AI速讀5萬篇AI頂會論文 免費上線-By8.1K星的熱門開源項目ChatPaper。

如題,自從上周說我們刷好了4.5w的頂會數據,已經過去剛好一周了,在我們團隊cc同學 @aceqwq 的持續爆肝下,這份有意思的數據,終於可以上線chatpaper.org,供大家免費查閱了!預祝大家速通近三年的AI頂會!另外,目前剛上線,有什麼bug,歡迎評論區留言!

Tips: 大家收藏的同時不要忘了點贊!

本貼將詳細介紹整個項目的由來和著重介紹頂會論文總結數據庫的使用。

1. 簡單聊聊開源後上熱門的ChatPaper:

  • 1 開發動機
  • 作為一個DRL方向的博士生,GPT3.5API和GPT4的發佈,讓我有了極大的危機感,AI的進化速度如此迅猛,作為看一篇英文論文,頭疼兩小時的人類,該怎麼不被快速淘汰?

    誰不愛玩手機呢~

    因此我想到,能不能讓魔法打敗魔法?讓AI幫助人類,降低閱讀門檻,節省閱讀時間,讓科研工作者在有限的時間內,借助AI的力量,獲得足夠多的信息。

    於是,我們想到了一個最簡潔的方案,就是論文總結。面對海量的論文,我們可以利用AI的強大文本總結能力,快速提取四個核心信息:1. 研究背景;2.過去方案和缺點;3.本文方案和步驟;4.本文實驗和性能。相比摘要,一般這樣提取的信息量會更加全面。大家可以在文獻調研時,快速判斷一篇新文章是否需要自己精讀,極大降低閱讀門檻和時間。

    2. 曾在GitHub熱榜三天

    幸運的是,這個項目剛開源第二天,承蒙GitHub官方看重,掛在熱榜第五連續三天,獲得了很高的曝光量,截至目前已經獲得8125個⭐,也得到了很多同學的支持和反饋。

    3.15號的截圖,哈哈,高光時刻

    這個工具算是滿足了大家的一個剛需,用於論文閱讀前的粗篩。尤其是批量總結,不管是本地文件夾存了很久的論文,還是從ArXiv中,直接就某個關鍵詞,訂閱近N天的最新論文。

    在此期間,更加幸運的是,有很多非常棒的同學加入維護團隊,為了整個項目的完善做出了重要貢獻,比如說shiwen同學的ChatReviewer 補齊了我們的審稿和審稿回復功能;榮勝同學使用百萬arXiv論文信息,在LLaMA模型上進行微調,做了一個論文題目生成模型 ChatGenTitle。

    3. http://ChatPaper.org網站上線

    在用戶的反饋中,我們得知,不是所有的同學都會配置這個工具。因此我們讓同學幫忙配置了一個網站,這樣就方便非計算機專業的同學們直接使用。

    這個網站之前的功能支持本地PDF的上傳,然後返回總結結果,以及提供arxiv的論文鏈接,網站幫你下載,再總結。由於費用的問題,目前每天僅能支持每個賬號2篇的免費額度《沒有付費,在其他問題沒解決之前,我們也不敢上線付費,敬請諒解,有更多需求的同學,歡迎使用我們開源的腳本》

    後期上線根據關鍵詞從arxiv訂閱最新論文的功能

    上周已經支持教育郵箱登錄,使用起來方便。

    4. 頂會論文總結數據庫

    雖然網站可以讓小白用戶使用起來更加方便,但是使用體驗還比較感人,用的人多了,經常要等好幾分鐘才能總結一篇。

    因此我們又想到,能不能將高價值的論文,提前總結好?大家需要的時候,直接刷就可以了。

    而價值最高,閱讀頻次也高的AI頂會論文自然是上上選。感謝另外一位大佬貢獻的項目paper_downloader,讓我們得以非常方便的下載好AAAI,ACCV,AIS他TS,COLT,CVPR,ECCV,ICCV,ICLR,ICML,IJCAI,JMLR,NIPS 這些頂會論文的PDF。

    還有一些不在表中

    於是,我們的cc同學 @aceqwq 這段時間,先是刷了4.5w的頂會論文總結數據庫,然後在google學術上統計基礎信息《作者,摘要,引用數等信息,雖然仍然有不全或者錯亂的情況,後面會上線編輯反饋的功能》,再接著將這些數據,在mingyuan同學的前端幫助下,整理排版好,終於在上周日凌晨上線網站!

    論文總結示例圖:有沒有感覺到,知識在往腦子裡湧入?

    5. 使用步驟:

  • 進入我們的網站:chatpaper.org
  • 使用教育郵箱註冊賬號。[如果無法註冊或者登錄,可以使用google瀏覽器的隱私模式]
  • 登錄賬號[一定要記住密碼,我們還沒上線 找回密碼 的功能 [開發時間實在不夠]]
  • 每天有2篇本地或者在線PDF總結的額度;
  • 上傳+提交即可,也可以選擇輸出的語言,換成英文也行;
  • 速通頂會論文。隻需要將頁面往下拉,選擇 年份,會議,關鍵詞,和排序,點擊search即可速通!
  • 後面還會加Arxiv最新的論文總結

    7. 展開總結全文:目前沒有給每個總結單獨的頁面,都是在首頁進行展示,需要看總結全文,點擊full即可。如果對全文感興趣,直接點擊下載鏈接。

    後期會上線是否有GitHub鏈接

    8. 下一頁:拉到頁面底部,點擊右下角的按鍵,進入下一頁。

    後面也許會上線page

    6. 關於額度和反爬的討論:

    因為這個數據庫的總結,花了我們團隊很多錢和精力,我們暫時不太想開源,希望大家能夠理解。

    然後因為我們開源習慣了,所以還是願意長期免費提供給大家進行查閱,希望能夠給整個社區帶來一些價值。

    因此我們做了這樣一個權衡,每天給用戶提供30-40篇的查閱額度[正常情況下,應該算充足?],希望大家手下留情,請不要爬我們的數據[qwq].

    如果大家有更好的方案,歡迎評論區留言!

    7. 其他的一些AI加速科研的小技巧分享:

  • 我們這個僅適用於初篩,精讀論文最好是靠自己閱讀原文!人的腦子和大語言模型類似,也需要高質量的長文本輸入輸出,才會有進步!
  • 精讀論文時,可以在大腦清醒的時候,拿走手機,念讀出來!除了單詞翻譯工具,其他的對話工具,都可能會影響你的思路!
  • GPTs作為某種意義上的條件概率生成模型,輸入內容多-輸出內容少,更能保證準確性和減少hallucination。
  • 基於關鍵詞的角色扮演:你現在是xx領域的教授xx,請幫我潤色下面的論文:[文本內容]
  • 格式化輸出:請按照xxx; xxx[yyy]的格式輸出/按照latex格式輸出
  • 格式化的示例《few-shot》:按照論文的經驗,提供一個完整的例子,便於LLM舉一反三。
  • 可驗證的文本生成:對於你懂的,但記不清,或者懂的不多的領域,可以嘗試讓它實現具體某個任務,事半功倍。 比如代碼生成,極大降低查閱文檔的時間;建議使用新必應 有報錯,把報錯信息貼回新必應; 長文本輸入輸出,建議使用GPT-4.
  • 哈佛博士的教程:GPT可以提供次優選項,讓人做選擇題,而不用做填空題。 https://twitter.com/kareem_carr/status/1640003536925917185
  • 9. 其他的教程可以參考我之前的帖子:ChatPaper的類似產品:BriefGPT,論文閱讀神器SciSpace(Typeset.io)測評,NewBing一分鐘速讀論文

    10. 我們後面正在開源眾籌另外一個項目,ChatOpenReview:利用OpenReview的優質審稿數據,微調出一個專業的審稿和審稿回復GPT,歡迎大家一起搞事。

    8. 最後:

    歡迎大家使用我們的論文總結數據庫,歡迎大家點贊和轉發這篇帖子,歡迎大家對我們後面的功能開發做反饋,希望我們團隊能為咱們的科研社區做點微小的貢獻~