返回首頁

標籤

transformer

Transformer 是處理序列資料的核心架構,從文字生成、圖像擴散到日誌異常偵測都常見其身影。它關注注意力機制、長距依賴與推論效率,也延伸到壓縮位元組、生成多樣性與交易系統等實作場景。

8 篇文章

5 個關鍵部件看懂 LLMs
產業動態/6月20日

5 個關鍵部件看懂 LLMs

5 個關鍵部件帶你看懂 LLMs 如何從資料、token、注意力到對齊,進而判斷訓練與部署該看什麼。

可變寬度 Transformer 省算力
技術研究/6月17日

可變寬度 Transformer 省算力

這篇論文證明,Transformer 不必每一層都同寬;把前後層加寬、中央層縮窄,可以在維持表現下減少計算與記憶體。

全雙工 MIMO 改用隱式估測
技術研究/5月24日

全雙工 MIMO 改用隱式估測

這篇論文證明,透過少量探測量測與 site-specific Transformer,就能在不明確重建自干擾通道的情況下做出有效波束設計。

大型語言模型是什麼,怎麼運作
技術研究/5月21日

大型語言模型是什麼,怎麼運作

大型語言模型把海量文字學成可預測 Token 的系統,能寫作、摘要、翻譯,也會胡說八道。

代理式 LLM 偏誤風險浮現
技術研究/5月6日

代理式 LLM 偏誤風險浮現

這篇論文把焦點放在代理式 AI 的偏誤風險,特別是已用在購物、影音與導覽等消費場景的 transformer-based 系統。

CLAD 直接看壓縮位元組抓異常
技術研究/4月15日

CLAD 直接看壓縮位元組抓異常

CLAD 直接在壓縮位元組流上做 log anomaly detection,省掉解壓與解析流程,摘要宣稱平均 F1 達 0.9909。

如何打造 AI 加密貨幣交易機器人
區塊鏈/4月2日

如何打造 AI 加密貨幣交易機器人

2026 AI 加密貨幣交易機器人實作指南:資料管線、模型選擇、風控、部署與合規,幫你把想法變成能上線的系統。

讓AI繪圖更有創意:用排斥力提升生成多樣性
技術研究/3月31日

讓AI繪圖更有創意:用排斥力提升生成多樣性

研究團隊在擴散Transformer中引入即時排斥機制,防止模式崩潰,生成更創意、更多元的文字轉圖像結果。