因為發現為了要讓頁面有一張圖,反而讓我延遲了發文的頻率。本來想用AI產生配圖,但覺得這不見得比較好,從今天開始發文將不一定配圖。可能只發純文字的文章。而文字的部分也將改成手工打字,避免用AI產生文字。
Q: Gemini的AI跟傳統的資料庫有何不同?
A: 傳統的資料庫像是檔案櫃,而AI則像是訓練過的大腦。
1. 精準匹配與語義理解
傳統資料庫要一對一對應才找得到資料,比方說找車子,但是查不到車輛。 AI則能理解車輛也是車子。
AI資料庫具有向量空間的特性。
2. 資料結構: 傳統的是取用資料,而AI是生成資料| 特性 | 傳統資料庫 | Gemini AI |
| 產出方式 | 檢索 (Retrieve):從硬碟抓取原本就存好的原始資料,原封不動呈現。 | 生成 (Generate):根據機率預測下一個字,重新組合成一段全新的對話。 |
| 正確性 | 極高。只要輸入沒錯,讀取的資料就是 100% 事實。 | 因為是生成的,代表具有「幻覺」風險。 |
| 彈性 | 缺乏彈性。只能讀取資料庫裡有的東西。 | 極高。可以根據儲存的知識進行推論、翻譯、摘要或創作。 |
Q 如果跟AI詢問特定資料庫的某個資訊,是不是很容易出錯?
沒錯! AI對於特定資料庫的取用,比方說某某資料庫的5月份的某個資料,AI在這方面非常容易出錯,因為AI只會讀取對該資料庫經過訓練的"印象",殘影來回答。往往這就是所謂的AI幻覺產生的原因。你如果問AI某本書的第203頁的第三行的內容,AI很容易出錯,但是他可能對大智的內容是正確的。
Q AI的總資料應該比資料庫的資料的檔案大小要小,請問與資料庫相比,AI的總資料壓縮率為多少?
A: AI模型的總體積遠小於它閱讀過的總資料量。大語言模型(LLM)就是這麼神奇! 本質上是終極的統計壓縮引擎。一般來說壓縮率落在於100~1000倍。但是LLM的壓縮率不能無限地提高,必須在模型容量與知識密度之間達到某種平衡。否則就會發生遺忘細節或是推理能力下降的問題。
[相關文章]

No comments:
Post a Comment