標籤
transformer
Transformer 是處理序列資料的核心架構,從文字生成、圖像擴散到日誌異常偵測都常見其身影。它關注注意力機制、長距依賴與推論效率,也延伸到壓縮位元組、生成多樣性與交易系統等實作場景。
8 篇文章

產業動態/6月20日
5 個關鍵部件看懂 LLMs
5 個關鍵部件帶你看懂 LLMs 如何從資料、token、注意力到對齊,進而判斷訓練與部署該看什麼。

技術研究/6月17日
可變寬度 Transformer 省算力
這篇論文證明,Transformer 不必每一層都同寬;把前後層加寬、中央層縮窄,可以在維持表現下減少計算與記憶體。

技術研究/5月24日
全雙工 MIMO 改用隱式估測
這篇論文證明,透過少量探測量測與 site-specific Transformer,就能在不明確重建自干擾通道的情況下做出有效波束設計。

技術研究/5月21日
大型語言模型是什麼,怎麼運作
大型語言模型把海量文字學成可預測 Token 的系統,能寫作、摘要、翻譯,也會胡說八道。

技術研究/5月6日
代理式 LLM 偏誤風險浮現
這篇論文把焦點放在代理式 AI 的偏誤風險,特別是已用在購物、影音與導覽等消費場景的 transformer-based 系統。

技術研究/4月15日
CLAD 直接看壓縮位元組抓異常
CLAD 直接在壓縮位元組流上做 log anomaly detection,省掉解壓與解析流程,摘要宣稱平均 F1 達 0.9909。

區塊鏈/4月2日
如何打造 AI 加密貨幣交易機器人
2026 AI 加密貨幣交易機器人實作指南:資料管線、模型選擇、風控、部署與合規,幫你把想法變成能上線的系統。

技術研究/3月31日
讓AI繪圖更有創意:用排斥力提升生成多樣性
研究團隊在擴散Transformer中引入即時排斥機制,防止模式崩潰,生成更創意、更多元的文字轉圖像結果。