java通過url讀取遠程數據並保持到本地

前幾天老姐突然告訴我，她在JD上買了本電子圖書，然後買完發現，只能在線或者使用它自己的閱讀器看，很不方便，讓我給想想辦法。
然後我就開始琢磨，最開始，我直接使用Acrobat Reader打開，發現只有目錄，沒有其他，而且頁面上面的都存在，我想可能在真正的內容上增加了一塊蒙版，只能有"鑰匙"的人可以過濾它，要破解別人的編輯器，短時間肯定是不行的，網上也有很多人想到使用自動化腳本去自動對官方閱讀器截圖，但是我發現，截圖不是一頁一頁的，這就很懵逼了。最後只能通過在線閱讀這條線來想辦法。
這個辦法和網友的類似，都是保存爲圖片，然後通過pdf工具製作成pdf。
在線閱讀我驚奇發現，在線文檔真好，一頁一張圖片，它已經給你做好，只是每次只更新出當前頁的前後幾張，其他的會被清除。到這裏，思路就有了：

跳轉到第n頁
拉取刷新出來的額圖片路徑
保存圖片路徑到緩存(我使用的是redis)
通過網絡工具類，將緩存中的圖片地址全部下載到本地本次爲圖片
將圖片通過pdf工作轉爲pdf
第1步到第3步需要重複，可以使用自動工具和腳本來實現。
第4步寫個控制器就可以了，最簡單的java接口就行。
第5步直接網上在線服務就可以實現。
爲什麼需要先緩存在下載咧，這裏涉及到一個效率與圖片去重和過濾的問題，因爲每次調整後獲取的圖片可能有重複的，存在redis的map中，自動就去重了；也是爲了避免一邊獲取圖片路徑，一邊下載中途異常退出等任務不能正常執行完畢等問題。然後腳本獲取路徑，後保存到自己的服務器，唯一的問題可能就是跨域的問題。結果發現還是少了幾張圖，這樣就體會出使用緩存的好處了，可以直接通過代碼驗證少了那幾張圖，不用去檢查jpg文件，少的文件個位數，最後通過手動補全了。
通過這種方式得到的圖片，唯一缺陷就是帶有"JD讀書"字樣和圖片分辨率不是很高，字體好像帶點毛腳。有強迫症或者追求高品質的，就使用官方閱讀器吧，個人看了蠻清晰的，是文檔，不是圖片！！！
下面附上java通過URL獲取網絡數據保存到本地的代碼。
```
public class HttpURLConnectionUtil {
// 通過get請求得到讀取器響應數據的數據流
public static InputStream getInputStreamByGet(String url) {
    try {
        HttpURLConnection conn = (HttpURLConnection) new URL(url)
                .openConnection();
        conn.setReadTimeout(5000);
        conn.setConnectTimeout(5000);
        conn.setRequestMethod("GET");
        if (conn.getResponseCode() == HttpURLConnection.HTTP_OK) {
            InputStream inputStream = conn.getInputStream();
            return inputStream;
        }
    } catch (IOException e) {
        e.printStackTrace();
    }
    return null;
}

// 將服務器響應的數據流存到本地文件
public static void saveData(InputStream is, File file) {
    try (BufferedInputStream bis = new BufferedInputStream(is);
         BufferedOutputStream bos = new BufferedOutputStream(
                 new FileOutputStream(file));) {
        byte[] buffer = new byte[1024];
        int len = -1;
        while ((len = bis.read(buffer)) != -1) {
            bos.write(buffer, 0, len);
            bos.flush();
        }
    } catch (IOException e) {
        e.printStackTrace();
    }
}
}
```

調用：

Set<String> imgNumber = (Set<String>) redisTemplate.opsForHash().keys(MAP_KEY);
imgNumber.stream().forEach(e->{
                String url = (String) redisTemplate.opsForHash().get(MAP_KEY,e);
                String fileName = e+".jpg";
                File file = new File("E:\\pdf圖片\\", fileName);

                InputStream inputStream = HttpURLConnectionUtil
                        .getInputStreamByGet(url);
                HttpURLConnectionUtil.saveData(inputStream, file);
});

此方法只適應已經購買了的電子書，未購買的不適用。建議還是到正規網站或書店購買，支持正版，尊重知識。

java通過url讀取遠程數據並保持到本地

通過f-string編寫簡潔高效的Python格式化輸出代碼

工作中用到的腳本合集

微服務實踐Aspire項目發佈到遠程k8s集羣

[轉帖]20個常用的Linux工具命令

[轉帖]PostgreSQL從小白到高手教程 - 第46講：poc-tpch測試

24-5-18 X

給服務器設置SSH空閒超時退出時間

poi讀取excel內容

頁面禁用鼠標右鍵和選擇

alert點擊確定後刷新了頁面與$().reset() is not a function

intellij idea 生成可執行jar 運行提示沒有主清單屬性

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結