AI辭典

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form.

應用程式介面

Application Programming Interface (API)

API，也稱為應用程式編程介面，是一套讓不同軟體程式能夠互相通訊和交換信息的規範和協定。它扮演著一種媒介的角色，使得各種程式能互動與協同運作，即便它們並未使用相同的程式語言或技術架構。API為不同軟體程式提供了一種交談和分享資料的途徑，有助於創造更加連貫且無縫的使用者體驗。

人工智能

Artificial Intelligence (AI)

在執行通常需要人類智能，如學習、解決問題、決策與語言理解等任務時，機器展示出的智慧。人工智能的實現來自於開發出可以處理、分析並理解大數據，以便根據這些數據做出決策的演算法和系統。

基準

Benchmark

基準（benchmarks）是衡量模型表現的標準或指標。

具體來說，基準可能包含一套特定的任務或數據集，這些任務或數據集用於評估模型的效能。

這些基準的選擇對於評估模型的實際效能和比較不同模型的能力具有重要性。

因此，基準在機器學習研究和開發中擔任了重要的角色，用於確認新的方法或技術的有效性。

ChatGPT

ChatGPT是由OpenAI研發的一種人工智慧對話機器人。

它能理解你的問題，並給出相關且有意義的回答。

這項技術主要用於寫作助手和其他語言處理任務。

它是一種模仿人類語言模式並提供幫助的工具。

命令行介面

Command Line Interface (CLI)

相比起圖形化界面（GUI），命令行介面（CLI）是另一種讓用戶與電腦互動的方法。

用戶可以輸入特定的文字指令，電腦會根據這些指令進行操作。

這種介面通常以純文字的形式展示，沒有圖形或圖像。

雖然初學者可能覺得命令行介面有點困難，但熟練使用後可以更有效率地控制電腦。

統一計算裝置架構

Compute Unified Device Architecture (CUDA)

統一計算裝置架構（CUDA）是一種讓電腦處理大型且困難的問題的策略，透過將問題分解為較小的片段並同時進行求解。這個架構利用電腦內的特殊硬體部件，名為GPU，使得電腦運算更有效率、更強大。就好比你有許多朋友一同幫忙拼圖，進程會比你獨自一人來得快許多。"CUDA"這個名詞是由NVIDIA公司所擁有的商標，此公司開發並大力推廣了這項技術。

數據處理

Data Processing

數據處理是準備原始數據以便在機器學習模型中使用的過程，此過程包含的任務包括清理、轉換以及正規化數據。

深度學習

Deep Learning (DL)

深度學習（DL）是機器學習的一個子領域，它利用擁有多層結構的深度神經網路，從資料中學習並識別複雜的模式。

詞嵌入

Embedding

我們如果希望電腦能理解語言，就必須將文字轉化為電腦可以理解的數字，而詞嵌入就是實現這一目標的手段。這是如何運作的：我們選取一個單詞，譬如“貓”，然後透過一種專門的演算法將其轉化為數字形式，該數字能捕捉到該單詞的意義。此演算法會參考該單詞在其他周圍單詞的語境中的用法。由此產生的數字表示了該單詞的含義，電腦便能理解這個單詞的含義，以及它與其他單詞的相互關聯。比方說，單詞“小貓”可能與“貓”有類似的數字表示，因為它們在意義上有所連結。同樣地，“狗”可能與“貓”的數字表示有所不同，因為它們的意義不同。這使電腦能夠理解單詞間的關係，並進一步理解語言。

未來工程學

Feature Engineering

未來工程學是一種從原始數據中選取並建立新特徵的過程，這些特徵能夠有效提升機器學習模型的效能。

生成對抗網絡

Generative Adversarial Network (GAN)

生成對抗網絡（GAN）是一種電腦程式，透過讓兩個神經網路對抗訓練，來創造新的元素，如圖像或音樂。其中一個網路名為"生成器"，負責創建新數據，另一個名為"鑑別器"，用以檢查數據的真實性。生成器透過從鑑別器得來的回饋進行學習，進而改善其數據生成能力，同時鑑別器也變得越來越擅長辨識假數據。這種互相對抗的學習過程持續進行，直到生成器能生產出即使是鑑別器也難以辨識真偽的數據。GAN可應用於各式各樣的場合，包含創造逼真的圖像、視頻、音樂，去除圖片與視頻的噪聲，以及創作全新風格的藝術。

生成對抗網路 (GAN) 包含兩個部分：

產生器會學習產生可產生的資料。產生的執行個體會成為歧視器的負面訓練範例。
歧視器學習如何將產生器和假資料與實際資料區分開來。歧視者會對生成機產生懲罰。

訓練開始時，產生器會產生明顯的假資料，而歧視器會快速學習它知道這是假的。

三個資料欄標示為「#39;GenerateData'」、「'Discriminator'」和「Real Data'」。在「#39;Generate Data'」(生成的資料) 下方，一個藍色矩形包含一個松鼠和一個圓圈。這個矩形是發電機最初的不好軌跡。在《##9; Real Data'》中，我們找到一張實際 10 美元帳單的圖片。'Discriminator' 這兩個字詞是 'FAKE' 和 'REAL'. 有一個箭頭從「#K9;FAKE'」字樣指向一個箭頭，指向「#39;Generate Data'」下方的圖片。另一個箭頭從「#AL」|「#39; ReAL'」出現的圖片中指向「#39;Real Data'」底下的圖片。

訓練進行時，產生器會更接近產生會產生結果的輸出內容：

這張圖片會在「#I9;Generate Data '」、「'Discriminator'」、「'Real Data ' Real Data'上圖」中的標題下方新增一列。在「##9;Generate Data'」下方，有一個左上角有個綠色矩形，數字為 10，旁邊是簡單的臉部圖畫。在《##9; Real Data'》中，我們找到一張實際 100 美元帳單的圖片。在「#39;Discriminator'」下方是「##9;FAKE'」一個箭頭，指向「#39;Generate Data'」和「'REAL'」下方的圖片。箭頭下方是「#39;Real Data'」下方的圖片。

最後，如果產生器產生器的運作情況良好，辨別器就更顯而易見的實際和虛構差異。這會開始將假資料真實分類，準確度也會降低。

此圖片會在「##9;Generate Data'」、「'Discriminator'」和「##9;Real Data' Real Data' First 圖片」中的標題下方新增一列。在「#39;Generate data'」底下，有一張二十美元帳單的圖片。在「 # 32 實境資料」下方，查看 20 美元帳單的圖片。在「#39;Discriminator'」下方是「##9;REAL'」一個箭頭，指向「'Generate Data'」和「'REAL'」下方圖中的箭頭。「#39;Real Data'」下方有箭頭。

整個系統的圖片如下：

生成對抗網路的圖表。圖表中央是標示為 'discriminator' 的方塊。兩個分支版本則會從左側往這個方塊中。上方分支版本位於圖表左上方，標有「#39;real world image'」的圓柱。一個箭頭從這個圓形指向另一個標示為「#39;Sample'」的方塊。標示「'Sample'」方塊的箭頭，指向「#39;Discriminator'」方塊。底部分支部分會送入 'Discriminator' 方塊，開頭為「'Random Input'」。一個箭頭從「#39;Random Input'」方塊引進，以標示為「##9;Generator'」的方塊。箭頭從「#39;Generator'」方塊導向第二個「##9;Sample'」方塊。一個箭頭從「##9;Sample'」方塊指向「##9;Discriminator」方塊。在「Dicriminator」方塊右側，箭頭會指向包含綠色圓圈和紅色圓圈的方塊。方塊上方的「'Real'」這個字樣會顯示在方塊上方的綠色文字中，「#39;False'」則在方塊下方以紅色顯示。兩個箭頭從這個方塊指向圖表右側的兩個方塊。其中一個箭頭會導向一個標示為「##39;Discriminator Loss'」的方塊。另一個箭頭會導向標示為「##39Generator Loss'」的方塊。

產生器和歧視者都是類神經網路。產生器輸出結果會直接連結至歧視輸入內容。透過反向傳播，歧視器的分類提供了發電機用來更新權重的訊號。

資料來源：Google for Developers

生成型藝術

Generative Art

生成藝術指的是透過創造一種過程來實現藝術創作，該過程可能包含自然語言規則、電腦程式、機械，或者其他形式的程序設計。

這些程序被設計為帶有一定自主性，進而在藝術創作中發揮作用或完成藝術作品。

此外，生成藝術的特點是充分利用隨機性或數學規則來產生獨一無二、不可預測的藝術效果。

GPT

Generative Pre-trained Transformer (GPT)

GPT，即Generative Pre-trained Transformer，是OpenAI研發的一種語言模型，旨在提供系統智能，並且已在ChatGPT等項目中得到應用。

GPT是一個利用轉換器架構的神經網絡模型家族，並在人工智能（AI）領域中作為一項關鍵性的進展，驅動著如ChatGPT等生成性AI應用。透過GPT模型，應用程序獲得了產生類人的文字與內容（例如圖像，音樂等）的能力。

大型語言模型測試室

Giant Language model Test Room (GLTR)

GLTR is a tool that helps people tell if a piece of text was written by a computer or a person. It does this by looking at how each word in the text is used and how likely it is that a computer would have chosen that word. GLTR is like a helper that shows you clues by coloring different parts of the sentence different colors. Green means the word is very likely to have been written by a person, yellow means it's not sure, red means it's more likely to have been written by a computer and violet means it's very likely to have been written by a computer.

GitHub

GitHub是一個專門用於託管和進行軟體專案協作的網路平台。

Google Colab

Google Colab（全名為Google Colaboratory）是一個允許使用者在雲端分享並執行Python腳本的線上平台。

圖形化介面

Graphical User Interface (GUI)

圖形用戶介面（GUI）是一種使電腦更容易使用的工具。

它將複雜的指令轉換成我們可以看到並點擊的圖標和按鈕。

對於平常人來說，許多AI工具（如AutoGPT和Stable Diffusion）在沒有任何GUI的情況下將難以使用。

顯示卡

Graphics Processing Unit (GPU)

GPU，也就是圖形處理單元，圖形卡，圖像式配卡，或顯示卡，是一種特殊的電腦芯片，設計用來處理在電腦或其他裝置上顯示圖像和視頻所需的複雜計算。

這就像是您的電腦圖形系統的大腦，而且非常擅長快速進行大量的數學運算。

GPU被應用在許多不同類型的裝置中，包括電腦、手機和遊戲機。對於需要大量處理能力的任務，例如玩視頻遊戲、渲染3D圖形或運行機器學習算法，它們特別有用。

🤗

HuggingFace

HuggingFace是一家位於紐約的聊天機器人初創服務商。 HuggingFace注重產品所帶來的情感和環境因素。
它還擁有一個大型的開源社區，其中最著名的是Transformers項目，提供了大量的預訓練語言模型結構和調用框架。
這些模型可以用來進行文本編碼、文本分類、閱讀理解和情感分類等任務。
不少其他的獨立開源AI項目會把研究報告甚至測試工具發佈到HuggingFace的網上平台上。

模仿學習

Imitation Learning

模仿學習是機器學習的一種方式，模型透過觀察並模仿專家的行為來學習完成任務，就像孩子看大人玩遊戲後學著玩一樣。

在語言模型中，"專家"是一個大型且複雜的語言模型，"學生"模型觀察專家模型對各種輸入的反應，並嘗試模仿這些反應。

這個過程的目的是製作出一個更小，但效率更高的模型，該模型能接近大型模型的性能，但使用更少的計算資源。這一點非常重要，因為大型模型在金錢和環境影響上的成本都很高。

雖然學生模型是被設計來模仿專家，但它並不一定能理解專家模型可能使用的深層原則或邏輯。它更像是模仿者，而非真正的學徒。

LangChain

Langchain

LangChain是一個協助用戶將人工智慧模型與外部資訊來源相連接的程式庫。

此工具讓用戶可以將來自不同來源的指令或查詢連結在一起，進而創造出能代表用戶執行操作的代理人或聊天機器人。

其主要目的在於簡化人工智慧模型與外部資訊來源連接的過程，從而實現更複雜且強大的人工智慧應用的可能性。

大型基礎模型

Large Foundation Model (LFM)

大型基礎模型（LFM）與大型語言模型（LLM）本質上是一樣的。這兩種名詞都涉及到經過大量文字數據訓練的AI模型，這些模型能夠依據其訓練產生人類語言般的文本。

大型語言模型

Large Language Model (LLM)

LLM（大型語言模型）具有理解與生成人類語言的能力。

無論你向它提問，它都能給出有益的回答；又或者你請它撰寫文章，它也能創作出充滿意義的文字。

實現這一切的方法，是通過學習大量的文字資訊，包含書籍、網頁和其他各類寫作形式的資料。

機器學習

Machine Learning (ML)

機器學習（Machine Learning, ML）是一種實現人工智能的技術，它允許電腦透過從資料中學習來改進自己的表現。以簡單的比喻來說，機器學習就像是教導孩子的過程。我們不直接向電腦指示該如何完成所有事情，而是透過提供範例和反饋，讓電腦自我學習並理解如何執行特定任務。

自然語言處理

Natural Language Processing (NLP)

自然語言處理（NLP）是一種讓電腦能夠理解、分析、產生，甚至回應人類語言的科技領域。這項技術讓電腦能理解人類的語言，不僅讓我們可以和電腦進行更自然的交流，也讓電腦有能力閱讀和理解人類寫的文章，進一步應用在翻譯、搜尋引擎優化、語音識別等領域。

神經網路

Neural Networks

神經網路可以想像成一個模仿人類大腦運作方式的機器學習系統。

在我們大腦裡，神經元會接收並處理來自我們感知的資訊，然後產生反應。

同樣地，神經網路會接收輸入（像是數據），透過一系列計算後產生輸出（預測結果）。

這些計算涉及到權重（這些都是可以被調整的數字，讓輸出結果更為精確）以及激活函數（這是用來決定該神經元是否該被激活，換句話說，是否應該產生輸出）。

神經輻射場

Neural Radiance Fields (NeRF)

神經輻射場是一種可以應用於多種任務的深度學習模型，這些任務包括圖像生成、物體識別以及區段切割。NeRF的獨特之處在於其運用神經網絡來模擬影像的輻射度，這是對物體發出或反射的光量的一種測量。

NVIDIA

Nvidia

NVIDIA 是一家跨國企業，專門生產圖形處理器、移動設備和計算機技術。NVIDIA 近期推出了眾多高性能的 CPU、GPU、高效運算平台以及旨在驅動眾多 AI 應用、解決方案與服務背後系統的軟件。NVIDIA 透過雲端服務、預訓練的基礎模型，以及最先進的框架、優化後的推理引擎和 API，為企業應用賦予智能。

OpenAI

OpenAI是個專門致力於研發與推動安全、透明、且能為社會帶來益處的人工智能技術的機構。

過度擬合

Overfitting

過度擬合是機器學習中一種常見的問題，這種情況下的模型對於訓練數據表現出色，然而對於新的、未曾接觸過的數據表現卻不理想。當模型過度複雜且從訓練數據中學習到過多的細節，它就無法有效地進行泛化。

參數

Parameter

在語言模型中，參數就好比模型的內在知識或"大腦"。這些參數是模型運用來判斷可能的最佳回答的數值集。

模型的參數數量也能反映其大小和複雜度。

參數較多的模型就如同大腦較大的模型——它可能能理解更多複雜的概念或做出更微妙的決策。

但同時，這也意味著它需要更多的計算資源來運行，並需要更多的數據來有效地進行訓練。

提示句

Prompt

提示句或指令句是用於引導大型語言模型並指導其文字生成的一段文字。

Python

Python是一種流行的高級編程語言，以其簡潔、易讀和靈活性而聞名（許多AI工具使用Python）

強化學習

Reinforcement Learning

強化學習或增強學習是機器學習的一種，指的是電腦透過與一個動態環境不斷重複地互動，來學習正確地執行一項任務。

這種方式下，機器會根據行動的結果得到獎勵或者懲罰。機器根據這些反饋來調整自己的行為，以在未來的類似情況下獲得更好的結果。

透過一次又一次的嘗試和學習，使電腦在沒有人類干預、沒有被寫入明確的執行任務程式下，找出最佳的行動策略來解決問題。

空間計算

Spatial Computing

空間計算利用科技，將數位訊息和體驗融入實體世界。

此概念包括如擴增實境，將數位訊息應用到現實視覺，或如虛擬實境，讓使用者可以完全置身於數位環境中，並允許用戶以自然的方式進行互動，例如移動、觸摸或語音命令。

空間計算是一種融合虛擬與現實環境的計算方式，利用電腦技術感知並互動於真實世界和虛擬世界之間的空間。

空間計算在多個領域有其廣泛應用，包括教育、娛樂與設計等，其革新的互動方式將改變我們與世界及人與人之間的互動方式。

Stable Diffusion

Stable Diffusion (SD)

SD能基於文字提示創造出複雜的藝術圖像。這是一款對所有人開放的開源AI圖像合成模型。您可以在GitHub上找到並在本地安裝SD，另外網上也有許多使用SD的用戶界面。

監督學習

Supervised Learning

監督學習是一種機器學習方式，它的訓練數據帶有標籤，模型則依據這些輸入數據與相對應標籤之間的關係來進行預測。

時間一致性

Temporal Coherence

時間一致性是指資訊或模式在時間軸上的一致性和連續性。這個概念在許多領域中，如電腦視覺、自然語言處理和時間序列分析中特別重要，因為AI模型需要處理和理解隨時間演變的數據。時間一致性可以從不同的角度來看，具體取決於應用的特定場景：

在電腦視覺中，時間一致性可能指的是視頻中視覺內容的流暢度和一致性，物體和場景應保持其特性和關係在各個畫面之間的一致性。

在自然語言處理中，它可能指的是文本或對話中資訊的一致性和流暢度，以確保AI模型生成的回應或摘要邏輯地跟隨先前的語句或事件。

在時間序列分析中，時間一致性可能與數據中模式和趨勢的一致性有關，以便AI模型可以基於過去的觀察來預測未來的值。

非監督式學習

Unsupervised Learning

非監督學習則是另一種機器學習方式，其訓練數據並無標籤，而模型則需要自我尋找數據中的模式與關係。

網路鉤子

Webhook

Webhook是一種讓電腦程式能透過網路即時傳遞訊息或數據至另一個程式的機制。它通過將訊息或數據傳送至特定的URL進行運作，該URL屬於接收端的程式。Webhook被廣泛運用於流程自動化，使得各種程式之間的溝通與協作更為便利。對於期望開發自訂化應用或打造不同軟體系統間整合的開發者來說，Webhook是一項極具價值的工具。

Credits: Some original definitions were found on Futuretools.io.