本帖最後由 s84292 於 2026-3-30 16:01 編輯
就算有了 Google TurboQuant 壓縮技術,人們只會把更多數據放入去,我唔覺得會用少啲RAM。 ...
chingkit 發表於 2026-3-30 13:32 
冇錯, 以前512GB 可以CACHE 1TB野,依家可以CACHE 4TB
但老實講依家個AI算力需求, 我覺得再升十倍都唔到飽和
比錢生成影片, BUSY 時段閒閒地都要排1個鍾隊, 快10倍都做唔到即時出
不過LLM 性能提高左幾倍的確係好事,希望快D實裝在LLM服務上, 等GEMINI PRO LOAD少D 空氣 |