我第一個開源AI小產品-video2blog即將正式發佈

前言

首先它是爲了解決我自己的個人問題。不管能不能幫到你,或者對於看到的你是否有點利用價值,也沒太大的關係,最起碼你可以來看看我開發小產品的整個過程。

一段時間以來,我開始通過youtube平臺來獲取一些知識,或者打發早晚上下班坐地鐵的時間。主要是我早晚通勤時間過長,差不多都是一個小時吧,單純的刷刷什麼某音、某紅的真真的浪費了大量的時間,所以我選擇了youtube平臺。我在 youtube 看視頻時,覺得有點用的信息我會截個圖,方便回頭查找關鍵字,尤其是看技術類的視頻。但有時候雖然截圖了,但是前後是有關聯的,關聯的地方當時又沒截圖,但是隱約的也記不起前後文的聯繫了,於是尷尬了,就只能重新翻看這個視頻了。因爲我遇到過好多次了,而且比較浪費時間。 於是就有了video2blog。

video2blog的開發歷程

通過視頻鏈接結合AI的能力,將整個視頻轉換爲一篇圖文筆記或者圖文博客。圖文最大的好處就是方便我自己回看,就像小時候我們自己的錯題筆記。

image 從3月底附近我就在琢磨我這個小產品了,但當時的思路還沒有打開,但是腦海中已經有了初步的設想。從那時起代碼就已經開始了,因爲要開發一個pc的客戶端,也有很多的技術沒有使用過,需要投入時間去研究一番。說真的還是有點小興致,畢竟是解決自己的痛點的。

image 剛好4月初跟隨清明節一起請了三天假,玩完回來狀態也非常的nice,那一週真的是瘋狂的碼碼查bug,也慢慢的有了上圖的自我感覺的清晰思路。 目前按照上圖基本上跑通了。但是很多功能還非常不完善或者還沒有加進來。比如視頻通過whisper來轉字幕目前通過python實驗成功,但沒加入到項目中,再比如對接AI的字幕轉長文功能也沒真正落地。這些都可以通過其他的工具來實現,所以暫時就先擱置一下,解決我覺得更重要的問題了。

image 我只能說一週的時間真的太短了,因爲平常還有別的項目在搞,上班的時候只能抽點時間來看看查查問題,優化下思路等等,更多的時候也在思考吧。有幾天真的也不太想上班了。

image 每週實現的功能也不多,但緊緊把把的能基本按照自己的預想在走,有時候一天的問題解決不了,我就擔心這進度要慢了,明天得抓緊時間了。

image 這裏我之前也在3月底的時候留過記錄。我自己的期待也是爭取5月底能有一個比較好的版本出來。就是提前儘量給自己做好計劃目標,哪怕沒完成,沒達到預期,也能在自己覆盤的時候找到問題,或者能總結出一些經驗教訓。

現狀

video2blog.excalidraw
video2blog.excalidraw

通過這個圖便可以簡單的看到我整個小產品的流程走向,其實現在看來流程清晰,思路也是比較簡單粗暴的。 當然了也有其他更好的使用模式。這裏暫時針對我自己算是現階段對我來說是一個比較好的模式選擇了。

我的小產品現階段藉助外部的AI工具是可以走通的。比如可以藉助Whisper模型進行語音轉文字,或者直接通過它來翻譯。 如果有字幕,字幕剛好是英文,也可以通過AI工具進行翻譯爲中文。翻譯爲中文後,再通過AI工具轉換爲文章或者叫筆記。 轉換爲文章的時候對prompt是有要求的,轉換的時候要添加上目錄,並且在目錄上添加上視頻中的時間區間,這樣方便我根據時間區間來獲取圖片並去除重複的圖片,然後選擇插入到文章中。

最後

現在預發佈這個小產品也算是對我自己,這一個多月時間的階段性總結。也是對我自己的一個小小的挑戰。因爲從來也沒有進行過對外發佈一個屬於自己的小產品,這也算是一次小小的嘗試。 很多時候有了想法,那就去做做試試看吧,也許其中有非常多的困難,但是隻有去做了才知道,這些個小困難在一天天的排解中,慢慢的也不算是個什麼困難了。 也許這個小產品並不是很完美,但最起碼我自己能夠慢慢的用起來了。

如果你覺得小工具還有點意思,便可以提前來玩一下看看。如果有什麼問題,也可以隨時聯繫我。 目前支持window和mac,在我自己的電腦上安裝嘗試都沒有問題的。當然可能會有兼容性的問題,畢竟第一次嘗試搞一個跨平臺的客戶端。

image
image

我創建了一個video2blog的微信羣。

可以關注我的公衆號:那個曾經的少年回來了

然後後臺發送消息: video2blog。

由於項目還沒真正的成型發佈,所以暫時就不將開源地址放出來了。因爲暫時也是堆疊功能代碼,主要以實現功能爲主。爭取5月底正式發佈第一個完整的版本。
最後如果產品思路對你有價值,你也可以快速復刻一個。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章