[TOOLS] 13 分鐘閱讀OraCore 編輯部

Best-paper 清單把噪音變成品味

把頂會 best paper 清單整理成可重複使用的研究品味追蹤器,直接拿去做讀書與選題工作流。

分享 LinkedIn
Best-paper 清單把噪音變成品味

把頂會 best paper 清單整理成可重複使用的研究品味追蹤器,直接拿去做讀書與選題工作流。

我以前也很愛把各種 best paper 清單丟進書籤,想說總有一天會看。結果通常是,存完就忘,忘完再焦慮,焦慮到 deadline 前才翻出來裝忙。這種用法很像在收集噪音,不像在建立判斷力。我後來盯上這個 Top-Conference-Best-Papers repo,才發現問題不是我不夠勤勞,是我一開始就把 best paper 當成新聞標題在看。

這個 repo 的厲害之處不是花俏,而是它很乾脆:把 ICLR、NeurIPS、ICML、ACL、EMNLP、NAACL、AAAI、CVPR、ECCV 的獎項 winners 整理起來,還刻意偏向 post-2022 的新東西。這讓我第一次有機會把「哪些題目被獎勵」當成一個可觀察的資料集,而不是一串看過就算的連結。

我最不爽的地方也在這裡。很多人讀 best paper,只會得到一種很虛的感覺:喔,這些論文很強。廢話,當然強。但到底強在哪?是題目選得準,方法乾淨,還是寫法讓 reviewer 一眼懂?如果不拆開看,最後只會把別人的品味當成自己的品味,然後以為自己進步了。

我不再把 award list 當新聞看

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

A curated list of Best Paper award winners from top ML/NLP venues.

翻譯一下就是:這個 repo 不是要做完整文獻庫,它是在做訊號濾鏡。這件事看起來很小,但其實很對。我要的不是所有 accepted paper,我要的是那些被委員會、program chair、reviewer 共識一起推上去的東西。

Best-paper 清單把噪音變成品味

我以前也犯過一個蠢:把 best paper 當成虛榮指標。後來才懂,重點不是獎牌本身,而是它把一個社群在某一年認為「值得被看見」的東西壓縮給你。這種壓縮很適合拿來訓練判斷力,尤其你如果在帶學生、選題目、或是在做自己的閱讀清單。

這個 repo 第一個值得學的地方,是它有篩選。它不是把整個學術宇宙都端上來,而是聚焦在 post-2022 的時段。這很重要,因為「好論文」這件事會隨時代變。2020 年的 ACL 強作,跟 2025 年的 ACL 強作,背後的問題壓力根本不是同一個世界。

我自己的做法是先問:這份清單到底想讓我看到什麼?在這裡,它想讓我看到的是 recency、prestige、award-level validation 的交集。這足夠拿來排閱讀順序,但不夠拿來寫 literature review。沒關係,本來就不該一魚兩吃。

  • 把 repo 當訊號采樣器,不要當 citation database。
  • 先看年份,再看 venue,最後才看題目。
  • 別盯單篇論文,先看重複出現的問題型態。

post-2022 這條線才是重點

Compared to similar repos/lists, this repo focuses on the post-2022 “post-GPT era” and puts extra emphasis on NLP venues.

這句話的意思很直白:它想回答的是「大型語言模型把基準線改掉之後,社群到底在獎勵什麼」。我很喜歡這種切法,因為它不會假裝 2018 跟 2025 是同一個世界。不是。ChatGPT 出來之後,很多 paper category 的意義都變了。

我自己對照過舊的 top paper 清單,感覺差很多。舊清單常常偏 benchmark、architecture tweak、理論漂亮話;新清單還是有這些,但我越看越常碰到 alignment、editing、inference efficiency、simulator learning、dataset contamination 這些題目。這不是雜訊,這是領域重心換了。

所以這個 cutoff 很有用,因為它逼你誠實。你如果真的想知道現在什麼會被獎勵,就不要把十年前的東西和現在混在一起,然後假裝趨勢很平滑。那只是自我安慰。recency 在這裡不是缺點,是篩選條件。

我會這樣做:自己切 era bucket。先分 pre-LLM、post-ChatGPT、current year,再看每個 bucket 裡的 winners 在解什麼問題。你會發現變的不只是方法,連問題本身都在漂移。

  • 先切時代,再切 venue。
  • 留意題目漂移:alignment、long-context、contamination、data efficiency。
  • 不要拿舊標準硬套新標準。

venue 不是標籤,是社群口味

repo 把 ICLR、NeurIPS、ICML、ACL、EMNLP、NAACL、CVPR、ICCV、ECCV、AAAI 都放進來,還把年份範圍列得很清楚。這很有用,因為它讓我能比較不同社群到底獎勵什麼,而不是假裝所有 conference 都在追同一種「好」。根本不是。

Best-paper 清單把噪音變成品味

我自己的粗暴分類是這樣:ICLR、NeurIPS 常常比較 method-forward,也比較 systems-aware;ACL、EMNLP、NAACL 會讓你看到 NLP 在理解、生成、評估、安全之間怎麼拉扯;CVPR、ECCV 比較像 vision 社群在看什麼東西不只是 leaderboard;AAAI 則很像一個廣角鏡,適合看整體 AI 風向。

這對我最實際的用途是選投稿 venue。當我講不清楚自己的 paper 為什麼符合某個 venue 的獎勵模式,我就會提高警覺。不是說不能投,而是表示我還沒把故事講對。這份清單等於把 venue identity 用 award 的方式攤開來看,比官網上的介紹誠實多了。

我會建議你這樣用:挑一個 venue、一個年份,把 best paper 跟 honorable mention 全部讀完。然後問三個問題:它獎勵的是什麼問題、需要什麼證據、寫法怎樣才會一眼看懂。這比亂讀一百篇 abstract 有效太多。

  • 用 venue slice 看社群偏好。
  • 把 honorable mention 一起看,抓邊界。
  • 不要以為一個 venue 的 taste 可以直接搬去另一個 venue。

標題其實在教你怎麼 framing

* Safety Alignment Should be Made More Than Just a Few Tokens Deep (ICLR 2025)

這句標題很兇,因為它不是在賣弄詞藻,是在直接講 failure mode。翻譯一下就是:安全對齊不能只做表面工夫。它把問題、漏洞、主張一次講完,reviewer 還沒進方法段就知道你要打哪裡。這不是巧合,這是強 paper 很常見的寫法。

我以前很常被那種「想法不差,但標題像棉花」的 paper 搞到很煩。看完不知道它到底在主張什麼,只知道作者很努力。這個 repo 的好處,就是你可以拿 award paper 當 framing 樣本,直接看它怎麼把貢獻壓縮進一句話裡。

像 “Transformers are Inherently Succinct” 這種標題就很像 thesis,不像行銷。又像 “Model Tells You What to Discard: Adaptive KV Cache Compression for LLMs”,它把動作、對象、技術點都講清楚。這種標題不是裝酷,是讓人快速判斷你有沒有真的在解問題。

我會這樣實操:寫標題時,先檢查它有沒有同時講到 object、mechanism、claim。若沒有,就再改。再來,把標題拿去問一個很兇的 reviewer:這句話到底在保證什麼?如果你自己都答不順,標題大概也不行。

另一個偷法是把 award paper 的標題拆成模板。不是照抄字面,而是抄結構。很多強標題其實都長得像「X 在 Y 條件下其實是 Z」或「X 不該只被當成 Y」。這種結構逼你精準,少一點廢話。

這份 repo 本質上是 taste dataset

I built this repo to develop better research taste by studying what the community consistently recognizes as high-impact work.

翻譯一下就是:這不是「best paper 蒐集器」,而是品味校正器。我很喜歡這個說法,因為 taste 這詞常常被講得很玄,好像只能靠天生。但其實你要的是 judgment,而且 judgment 是可以練的。你只要看夠多被共同認可的好東西,就會開始看到模式。

我也拿這種清單去帶過新手。大家最常問的問題是:「什麼叫好?」老實說,這題沒有標準答案,但 award winners 至少能給你一個社群在壓力下仍願意承認的下限。不是天花板,但很夠用了。

我會把 taste 拆成三塊:

  • Problem taste:這題是不是現在真的值得做。
  • Method taste:技術是不是乾淨,不是只會堆。
  • Presentation taste:寫法能不能讓人一眼懂你在幹嘛。

實操上,我不建議你只是 bookmark。你應該做一個小 rubric。每篇 winner 都評一遍 problem、method、evidence、writing。看完十篇,你就會開始看到 pattern。那時候 taste 才會從玄學變成可訓練的東西。

honorable mention 才是邊界線

Outstanding Paper Honorable Mentions

這句話的價值常被低估。很多人只看 winner,但我反而更愛看 honorable mention。因為它們告訴你「差一點就被獎勵」的樣子。winners 告訴你門檻在哪,honorable mentions 告訴你門檻附近長什麼樣。

我常覺得 near-miss 論文比冠軍更有教學價值。它們通常也很強,只是可能少了一點完整性、一點聚焦、一點證據密度,或是一點寫作上的俐落。這些東西正好可以拿來理解一個 venue 的風險容忍度。

如果你正在寫一篇想要「夠大膽但不要太莽」的 paper,honorable mention 很值得讀。它們會讓你看到社群願意給予肯定、但還沒到壓倒性認可的作品。這種邊界感很實用,尤其對容易過度設計或過度保守的人來說。

我的做法是另外開一個 reading queue 給 honorable mentions,不把它們當剩菜。它們其實是最接近邊界的樣本,最容易教你怎麼拿捏。

你可以直接抄的工作流

我如果今天要把這個 repo 真正用起來,不會只停在看。我會把它變成一個固定流程,讓每週、每月都能跑一次。這樣你不是在追 paper,你是在追 pattern。

先選一個 venue,一次只看一個年份。從 best paper 開始,再看 honorable mentions。每篇只寫三句:它解了什麼問題、核心想法是什麼、為什麼社群會給它獎。這三句寫得出來,你就真的看懂了;寫不出來,代表你只是滑過去。

再來,把每篇論文打分。不是為了裝專業,是為了讓你自己的 taste 有可比較的尺。你可以看 problem importance、timeliness、technical novelty、experimental rigor、clarity of presentation、reusability of ideas。這幾個維度夠用了。

最後,每個月做一次總結。問自己:哪些題目一直出現?哪些 title 結構特別有效?哪些 venue 的證據標準比較硬?哪些 paper 真的改變了我對這個領域的判斷?這些答案會比「我又讀了多少篇」有價值得多。

可抄的模板

# Research Taste Tracker from Best Papers

## Goal
把頂會 best paper / honorable mention 變成一個可持續更新的研究品味追蹤器。

## Scope
- Years: 2022–present
- Venues: ICLR, NeurIPS, ICML, ACL, EMNLP, NAACL, AAAI, CVPR, ICCV, ECCV
- Include: Best Paper, Outstanding Paper, Honorable Mention

## Fields to capture
- Year
- Venue
- Award type
- Paper title
- Authors
- Paper URL
- One-sentence takeaway
- Problem type
- Method type
- Why it likely won
- Framing / writing notes

## Reading workflow
1. 每次只選一個 venue + 一個年份。
2. 先讀 winner,再讀 honorable mentions。
3. 每篇只寫 3 句:
   - 它解了什麼問題?
   - 核心想法是什麼?
   - 為什麼社群會給它獎?
4. 每月跨 venue 比一次。
5. 把重複出現的 pattern 寫進一份短備忘。

## Taste rubric
每篇論文打 1–5 分:
- Problem importance
- Timeliness
- Technical novelty
- Experimental rigor
- Clarity of presentation
- Reusability of ideas

## Pattern log
持續記錄:
- 重複出現的題目
- 常見失敗模式
- 有效的標題結構
- 不同 venue 的證據標準
- 反覆出現的方法型態

## Copy-ready note template
### [Year] [Venue] — [Award type]
**Paper:**
**Authors:**
**Link:**
**One-line takeaway:**
**Why it mattered:**
**Problem type:**
**Method type:**
**Framing lesson:**
**Evidence lesson:**
**What I would borrow:**
**What I would avoid:**

## Monthly synthesis
每月底寫一次:
- 3 個我看到的 pattern
- 2 個我現在更相信的 claim
- 1 個我沒那麼相信的 claim
- 1 個我更懂的 venue taste
- 1 個值得偷到自己工作裡的 idea

這段我會直接貼進 Notion、markdown file,或 lab wiki。重點不是漂亮,而是能重複執行。repo 本身只是清單,真正的價值是把清單變成 workflow,逼你每週都做比較。

如果你想再往前一步,我會搭配官方 venue 頁面和 paper 原文一起看,像是 OpenReviewNeurIPS proceedingsICMLACL Anthology。repo 當入口就好,不要把它當整棟大樓。

原始來源是 FeijiangHan/Top-Conference-Best-Papers。我這篇是從它的結構延伸出的拆解與工作流模板,原創的是方法論整理與可抄版本,不是重貼 repo 內容。