第二章 文字媒體
1.輸入方式:
(1)鍵盤: 字根類與字音類輸入法
(2)OCR光學字元辨識
(3)手寫辨識
(4)語音辨識
2.儲存格式-文字內碼: ASCII與BIG-5
內碼 - 文字在電腦內的表示方法
3.顯示格式-字型: 點陣字與描邊字
字型 -文字在電腦內的展現工具
#ASCII
碼
(1)目前最為通用的文字碼
(2)包含大小寫英文字母、阿拉伯數字、各種標點符號及一些特殊的內碼
(3)以 8 個位元代表
(4)ASCII
碼總共為 0~255,在一般的計算機概論書籍都可以看到
ASCII 內碼的對照表
#BIG-5
碼
(1)廣泛使用的一種中文內碼
(2)以 16 位元來表示一個中文字
(3)16
位元共有 216
種也就是 65536
種組合,已能滿足一般中文字所需的數量
(4)早期中文內碼的不統一造成文字資料在不同系統中交換的困難
(5)大陸中文內碼以使用 GB 碼為多,和 BIG-5 碼不相容,文字資料必須轉碼
4.點陣字
(1)將文字以一個個方格點排列成矩形所構成
(2)最早發展出來的字型表現方式
(3)依使用的點之數量不同,品質亦不同
(4)點數愈多,則字型愈精細,相對著字型所佔的儲存記憶空間也就愈大
(5)製作簡單、對於解析度小的字體佔極少的儲存空間
(6)點陣字的缺點
(a)鋸齒狀現象
(b)不管是多少個點所構成的字型,只要是放得夠大,就會看得出鋸齒狀的現象
(c)字型無法自由放大
(d)必須搭配對應的字型
ex:對於小的字,可用 16x16 字型,大一點的字則必須使用 32x32 或解析度更高的字型
(e)字型解析度過高時,相當浪費儲存空間
ex:128x128
點陣字所佔儲存空間為 16x16
點陣字型的 64
倍
5.描邊字
(1)採用數學運算方式產生的字型
描邊字儲存字型所對應的數學式,使用時依公式計算轉換為對應的字形輪廓
(2)在放大或縮小時,不會像點陣字一樣有形成鋸齒狀的問題
(3)系統中,包含的基本中文字型中即有「細明體」、「新細明體」與「標楷體」。這些字體稱為 TrueType 字型,屬於描邊字型
6.文件資料儲存
(1)文字用以儲存資料,把工作與生活中的訊息加以儲存
中文字每個字佔 2 個 Bytes ,百萬字小說約 200 萬 Bytes ,也就是 只需
2MB 儲存空間
(2)存在電腦的文字資料沒有受潮、遭蟲蛀、發黃老舊… 等顧慮
7.資料搜尋與比對
(1)文數字資料是所有的媒體中最便於查詢與比對的資料
(2)文數字本身資訊的內容極為明確清楚的,適合於查詢
(3)例如搜尋引擎對特定文字字串的查詢
(4)應安裝好合適的字型,並設定正確的內碼,即可閱覽其他國家的的網站—多語系的平台
參考資料:http://faculty.pccu.edu.tw/~cweng/IntroMM1.htm
沒有留言:
張貼留言