微信聊天記錄導(dǎo)出的開源項目,火了!
分享一個有點兒意思的開源項目~
一、留痕
最近想訓練一個符合某人說話風格的 AI,微信的聊天記錄里就有著豐富的訓練數(shù)據(jù)。
聊天記錄是珍貴的記憶,也是每一場對話、每一個互動的真情流露。
想要拿到這些數(shù)據(jù),無論是保存?zhèn)浞葸€是用于 AI 訓練,手動拷貝都不現(xiàn)實。逛 Github 發(fā)現(xiàn)了這個不錯的項目:留痕。
這是一名西北工業(yè)大學的學生開源的一個項目,作者這樣說道:
使用方法非常簡單:將手機的聊天記錄遷移到電腦,然后使用WeChatMsg解密。
安卓:手機微信->我->設(shè)置->聊天->聊天記錄遷移與備份->遷移-> 遷移到電腦微信;
iOS:手機微信->我->設(shè)置->通用->聊天記錄遷移與備份->遷移-> 遷移到電腦微信。
遷移完成后重啟微信,遷移前也最好提前備份一下聊天數(shù)據(jù)。
然后 clone 項目并安裝依賴:
# Python>=3.10 僅支持3.10、3.11、3.12,請勿使用其他Python版本
git clone https://github.com/LC044/WeChatMsg
cd WeChatMsg
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
直接運行 main.py 即可解析數(shù)據(jù)。
python main.py
效果演示
解析好的數(shù)據(jù),可以做清洗,用于 AI 模型訓練,也可以用于個人的數(shù)據(jù)分析。
項目地址:
https://github.com/LC044/WeChatMsg
最后,魚皮還是要提醒大家,對于不是很懂代碼的同學,一定要謹慎使用此類讀取個人數(shù)據(jù)的項目 / 軟件,防止個人隱私的泄露。能看懂代碼的同學,可以先全局觀察下有沒有 “后門” 和發(fā)請求的代碼,再去使用。不過這個項目 star 數(shù)超過 2w,已經(jīng)很有名氣了,沒什么問題,可以玩一玩 / 學一學。
有需要的自取。 又到了 收藏等于學會 的時候了~
???? 點擊下方閱讀原文,獲取魚皮往期編程干貨。
往期推薦
魚皮原創(chuàng) 7 大實戰(zhàn)項目,保姆教程!
