【中華百科全書●工學●電腦檔案設計】 使用電腦處理資料常見的作業程序是建檔、更新和取用三個步驟。
建檔是指將資料儲存在磁帶或磁碟中;
更新是指根據異動資料來修正檔案的內容,以確保檔案的正確性和完整性;
取用則指利用檔案提取或製作資訊。
一個良好檔案必備的條件很多,簡言之,就是符合目標、使資料存得多、找得快、費用低廉及操作簡單。
要達到這些要求必須講究檔案設計的方法,底下將分檔案資料的型式和性質、檔案組織的型態及其優缺點和適用對象與時機、檔案的性能、設計的原則以及分析師的步驟等來討論。
一、檔案資料的形式如果以檔案資料的長度和版段(Block)的情況來區別,則檔案資料的形式可分為下列四種:固定長度無版段、固定長度有版段、可變長度無版段和可變長度有版段。
一般而言,固定長度的資料形式程式設計比較簡單,可變長度的則比較麻煩;
有版段的資料形式電腦處理的速度較快、經濟效果好,而無版段的則處理速度慢、經濟效果也較差。
二、檔案資料的性質如果以檔案資料的性質及其作業特性來區別,則檔案可分成主檔、異動檔、印表檔和歷史檔等四種。
主檔通常是存放大量經常需要利用或參考的資料,例如人事主檔和客戶主檔等;
異動檔是存放那些經常都在變動的資料,例如庫存資料;
印表檔是為了方便印表,從主檔中提出一些資料項目做為暫用性的工作檔;
歷史檔則是存放一些不常使用的資料,但偶爾也會調閱,通常是將歷史檔放在比較經濟的磁帶上。
三、檔案組織的形態和適用對象與時機存放檔案資料的媒體和方法很多,在電腦資料處理方面以磁帶和磁碟最為普遍。
磁帶上的檔案資料只能以循序方式來處理,而磁碟中的檔案資料則可以隨機方式作業,因此一般的電腦系統大都以磁碟為主要的輔助記憶體。
一般常見的傳統檔案有下列三種:循序存取檔(SequentialAccessMethodFile簡稱SAM檔)、隨機存取檔(RandomAccessMethodFile簡稱RAM檔)和索引循序存取檔(IndexSequentialAccessMethodFile簡稱ISAM檔)。
另外有一種新的檔案設計,請查閱本冊資料庫設計一詞。
底下將分述上面三種組織形態的檔案,及其優缺點和適用對象與時機。
(一)循序存取檔:循序存取法是最基本的檔案設計方法,各個資料錄依照鍵號的順序存放在磁帶或磁碟上,在更新或取用時也須依照鍵號的順序循序處理,因此異動資料須事先分類(Sorting)。
此種檔案在成批作業(BatchOrientedDataProcessing)時最常使用。
成批作業就是將一企業的異動資料先集中成批,收集到一定數量後才做整批處理。
成批作業常出現於週期性業務的處理,例如庫存清單登記、每月帳目處理和一季稅收報告等等。
循序存取檔建檔的主要步驟為:1.打開檔(OpenFile);
2.讀取資料並將它移到輸出區域;
3.將資料寫到媒體(磁帶或磁碟)上。
循序存取檔的優缺點和適用對象如下:1.優點:(1)使用簡單;
(2)資料須依照順序處理時,速度最快;
(3)可充分的利用媒體的空間,媒體的儲存密度最高;
(4)構造簡單,不需要複雜的作業系統,因此可使用於小型的電腦系統;
(5)容許重複的資料;
(6)可以將修正後的資料放回原處;
(7)可以在原有的檔案後面順序追補資料。
2.缺點:(1)不便於中間插入新的資料;
(2)不能隨機處理資料,異動資料必須事先分類,且在大量的主檔中尋找少部分的資料時很不方便;
(3)不能借助系統程式管理資料,用戶的程式設計負擔較重。
3.適用對象與時機:(1)可以用來存放表格性質的資料;
(2)可以當作分類時的工作區;
(3)可以用於活動比率高的更新作業處理。
(二)隨機存取檔:隨機存取法處理資料錄時不須仰賴循序順序,克服了循序存取檔的最大限制。
此種檔案在存放資料錄時,是將其鍵號透過某一公式計算而得出存放位址;
更新或取用資料錄時,也是按照同一公式計算得其存放位址。
當兩個不同的鍵號具有相同的存放位址時,通常是把後來的資料錄放在溢位區(OverflowArea),而兩資料錄間有鏈連結,電腦可依此鏈找到所要的資料錄。
一個良好的隨機存取檔,求算位址的公式應當簡單易算,而且算得同一位址的機率要低;
當算得同一位址時也要有一套簡便的方法來處理。
隨機存取檔的優缺點和適用對象與時機如下:1.優點:(1)可以隨機處理資料,所以能用於線上即時系統;
(2)處理資料時,異動檔不必先行分類;
(3)追加或刪除檔案中的資料很方便;
(4)不需要有索引區(IndexArea);
(5)從大量的檔案資料中尋找少部分的資料時最快,而且尋找任一資料錄的時間幾乎相同;
(6)可以借助系統程式,用戶沒有太大的程式設計負擔。
2.缺點:(1)檔案中的資料錄不能組成版段;
(2)不能容許相同鍵號的資料錄存在;
(3)必須考慮計算位址的公式;
(4)必須考慮算得相同位址時的對策;
(5)必須考慮溢位區飽和時的對策;
(6)不便按照鍵號的大小順序來處理資料;
(7)磁碟容易產生空白區,浪費儲存體。
3.適用對象與時機:(1)資料需要高速度、隨機處理時;
(2)主記憶體容量不大,而需要隨機存取資料時;
(3)需要線上即時作業時;
(4)資料追加的可能性大時;
(5)資料的活動比率很低時。
(三)索引循序存取檔:索引循序存取法是最常用的檔案設計方法。
各個資料錄在磁碟中是依照鍵號的順序循序存放,但另外有一索引區域存放某些鍵號資料的存放位址,在更新或取用資料錄時,可以利用這些索引區確定資料錄約存放區域。
索引存取檔是由索引區、純資料區和溢位區所組成。
索引區又分三個索引階層,是存放索引的區域;
純資料區是存放資料的區域;
溢位區則存放超溢資料的區域。
決定建立索引循序存取檔時,使用者必須先完成下列工作:1.利用控制卡指定索引區、純資料區和溢位區所在的磁碟機位址、磁碟編號和它們在磁碟中的大小與位置;
2.在程式中指定資料錄的那一欄是錄鍵、每一柱面(Cylinder)留多少磁道作為柱面溢位區域;
3.程式負責讀入資料,並按照鍵的順序交給索引循序存取載入常規(Routine)來建立索引循序存取檔案。
索引循序存取檔的優缺點及適用對象與時機如下:1.優點:(1)隨機處理或循序處理資料時,效率都很好;
(2)作業簡單,磁碟的儲存密度中等;
(3)備有溢位區,便於追加或刪除資料。
2.缺點:(1)必須在磁碟中配置索引區域,稍為浪費儲存體;
(2)需要很多系統軟體工作,成本較高;
(3)必須時常重組檔案中的資料;
(4)對溢位的資料錄處理比較麻煩。
3.適用對象與時機:(1)需要同時兼顧隨機處理和循序處理資料時;
(2)資料的活動比率中等時。
四、檔案性能的衡量一個檔案性能的優劣通常經由下列各項來衡量:(1)讀一資料錄的時間;
(2)寫一資料錄的時間;
(2)更新(插入或刪除)一資料錄的時間;
(4)處理整個檔所需要的時間;
(5)檔案重組所需要的時間;
(6)一資料錄所占的記憶體的多少;
(7)保留記憶體空間的使用率。
五、檔案設計的原則規劃和設計檔案時應遵守下列各原則:(一)儘量降低檔案的存取次數;
(二)儘量減少檔案所占的空間;
(三)增強系統的完整性;
(四)重視檔案的性能;
(五)在增進效率之前,應先做成本效益分析;
(六)資料的活動比率大於百分之二十時,以循序存取檔最為有效;
資料的活動比率很低時,以隨機存取檔較為有利;
資料的活動比率介於兩者之間時,以索引循序存取檔最為方便;
(七)檔案在磁碟裏所占的區域宜深而長,不宜淺而寬,如此可以縮短磁碟讀寫頭尋找資料的時間;
(八)避免將一個檔案的區域和另一個檔案的區城重疊;
(九)必要時預留些磁碟空間,以免經常重編檔案資料;
(十)決定版段大小時,應注意讓一個版段的資料能存在於一個磁道中。
六、分析師的步驟為了有效定義一檔案,分析師應依下列步驟來完成:(一)預算多少?
(二)檔案的目標是什麼?
(三)需要何種應用程式?
(四)檔的動態狀況如何?
包括資料量的多寡和其成長特性。
(五)資料應如何處理,報表如何印製?
(六)應使用何種檔案組織?
(七)裝配的因難為何?
包括程式設計師的素質和能力、磁帶和磁碟的設置實情。
(八)系統的總體考慮是什麼?
(九)此種選擇的成本是多少?
(十)總費用是多少?
(十一)完成之檔案的目的是否有所偏差?
(十二)對以上的步驟反覆演算,直到對結果滿意為止。
(十三)產生檔案系統的描述。
(林國棟)
引用:http://ap6.pccu.edu.tw/Encyclopedia/data.asp?id=8306 |