資源描述:
《多媒體數(shù)據(jù)庫技術(shù)》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、第10章多媒體數(shù)據(jù)庫技術(shù)數(shù)據(jù)管理技術(shù)的發(fā)展可以大體歸為三個(gè)階段:人工管理文件系統(tǒng)數(shù)據(jù)庫管理系統(tǒng)。人工管理這一階段(20世紀(jì)50年代中期以前),計(jì)算機(jī)主要用于科學(xué)計(jì)算。外部存儲器只有磁帶、卡片和紙帶等還沒有磁盤等直接存取存儲設(shè)備。軟件只有匯編語言,尚無數(shù)據(jù)管理方面的軟件。數(shù)據(jù)處理方式基本是批處理。這個(gè)階段有如下幾個(gè)特點(diǎn):1.計(jì)算機(jī)系統(tǒng)不提供對用戶數(shù)據(jù)的管理功能。用戶編制程序時(shí),必須全面考慮好相關(guān)的數(shù)據(jù),包括數(shù)據(jù)的定義、存儲結(jié)構(gòu)以及存取方法等。程序和數(shù)據(jù)是一個(gè)不可分割的整體。數(shù)據(jù)脫離了程序就無任何存在的價(jià)值,數(shù)據(jù)無獨(dú)立性。2.數(shù)據(jù)不能共享。不同的程序均有各自的數(shù)據(jù)
2、,這些數(shù)據(jù)對不同的程序通常是不相同的,不可共享;即使不同的程序使用了相同的一組數(shù)據(jù),這些數(shù)據(jù)也不能共享,程序中仍然需要各自加人這組數(shù)據(jù),誰也不能省略。基于這種數(shù)據(jù)的不可共享性,必然導(dǎo)致程序與程序之間存在大量的重復(fù)數(shù)據(jù),浪費(fèi)了存儲空間。3.不單獨(dú)保存數(shù)據(jù)?;跀?shù)據(jù)與程序是一個(gè)整體,數(shù)據(jù)只為本程序所使用,數(shù)據(jù)只有與相應(yīng)的程序一起保存才有價(jià)值,否則就毫無用處。所以,所有程序的數(shù)據(jù)均不單獨(dú)保存。文件系統(tǒng)在這一階段(20世紀(jì)50年代后期至60年代中期)計(jì)算機(jī)不僅用于科學(xué)計(jì)算,還利用在信息管理方面。此時(shí),外部存儲器已有磁盤、磁鼓等直接存取的存儲設(shè)備。軟件領(lǐng)域出現(xiàn)了操作系統(tǒng)
3、和高級軟件。操作系統(tǒng)中的文件系統(tǒng)是專門管理外存的數(shù)據(jù)管理軟件,文件是操作系統(tǒng)管理的重要資源之一。數(shù)據(jù)處理方式有批處理,也有聯(lián)機(jī)實(shí)時(shí)處理。這個(gè)階段有如下幾個(gè)特點(diǎn):1.數(shù)據(jù)以“文件”形式可長期保存在外部存儲器的磁盤上。。2.數(shù)據(jù)的邏輯結(jié)構(gòu)與物理結(jié)構(gòu)有了區(qū)別,但比較簡單。程序與數(shù)據(jù)之間具有“設(shè)備獨(dú)立性”,即程序只需用文件名就可與數(shù)據(jù)打交道,不必關(guān)心數(shù)據(jù)的物理位置。由操作系統(tǒng)的文件系統(tǒng)提供存取方法(讀/寫)。3.文件組織已多樣化。有索引文件、鏈接文件和直接存取文件等。但文件之間相互獨(dú)立、缺乏聯(lián)系。數(shù)據(jù)之間的聯(lián)系要通過程序去構(gòu)造。4.數(shù)據(jù)不再屬于某個(gè)特定的程序,可以重復(fù)
4、使用,即數(shù)據(jù)面向應(yīng)用。但是文件結(jié)構(gòu)的設(shè)計(jì)仍然是基于特定的用途,程序基于特定的物理結(jié)構(gòu)和存取方法,因此程序與數(shù)據(jù)結(jié)構(gòu)之間的依賴關(guān)系并未根本改變。5.對數(shù)據(jù)的操作以記錄為單位。這是由于文件中只存儲數(shù)據(jù),不存儲文件記錄的結(jié)構(gòu)描述信息。文件的建立、存取、查詢、插人、刪除、修改等所有操作,都要用程序來實(shí)現(xiàn)。隨著數(shù)據(jù)管理規(guī)模的擴(kuò)大,數(shù)據(jù)量急劇增加,文件系統(tǒng)顯露出一些缺陷:a.數(shù)據(jù)冗余。由于文件之間缺乏聯(lián)系,造成每個(gè)應(yīng)用程序都有對應(yīng)的文件,有可能同樣的數(shù)據(jù)在多個(gè)文件中重復(fù)存儲。b.不一致性。這往往是由數(shù)據(jù)冗余造成的,在進(jìn)行更新操作時(shí),稍不謹(jǐn)慎,就可能使同樣的數(shù)據(jù)在不同的文件
5、中不一樣。數(shù)據(jù)聯(lián)系弱。這是由于文件之間相互獨(dú)立,缺乏聯(lián)系造成的。c.文件系統(tǒng)階段是數(shù)據(jù)管理技術(shù)發(fā)展中的一個(gè)重要階段。在這一階段中,得到充分發(fā)展的數(shù)據(jù)結(jié)構(gòu)和算法豐富了計(jì)算機(jī)科學(xué),為數(shù)據(jù)管理技術(shù)的進(jìn)一步發(fā)展打下了基礎(chǔ),現(xiàn)在仍是計(jì)算機(jī)軟件科學(xué)的重要基礎(chǔ)。數(shù)據(jù)庫管理系統(tǒng)這一階段(60年代后期),數(shù)據(jù)管理技術(shù)進(jìn)入數(shù)據(jù)庫系統(tǒng)階段。數(shù)據(jù)庫系統(tǒng)克服了文件系統(tǒng)的缺陷,提供了對數(shù)據(jù)更高級、更有效的管理。這個(gè)階段的程序和數(shù)據(jù)的聯(lián)系通過數(shù)據(jù)庫管理系統(tǒng)來實(shí)現(xiàn)(DBMS)近年來,隨著多媒體數(shù)據(jù)庫的引入,對數(shù)據(jù)的管理方法又開始醞釀新的變革。我們知道,傳統(tǒng)數(shù)據(jù)庫的模型主要針對整數(shù)、實(shí)數(shù)、定
6、長字符等規(guī)范數(shù)據(jù)。數(shù)據(jù)庫的設(shè)計(jì)者必須把真實(shí)的世界抽象為規(guī)范數(shù)據(jù),這要求設(shè)計(jì)者具有一定的技巧,而且在一定情況下,這項(xiàng)工作會特別的困難。即使抽象完成了,抽象得到的結(jié)果往往會損失部分的原始信息,甚至?xí)霈F(xiàn)錯誤。當(dāng)圖像、聲音、動態(tài)視頻等多媒體信息引入計(jì)算機(jī)之后,可以表達(dá)的信息范圍大大擴(kuò)展,但又帶來許多新的問題。在這種情況下,如何使用數(shù)據(jù)庫系統(tǒng)來描述這些數(shù)據(jù)呢?另一方面,傳統(tǒng)數(shù)據(jù)庫可以在用戶給出查詢條件之后迅速地檢索到正確的信息,但那是針對使用字符數(shù)值型數(shù)據(jù)的。現(xiàn)在,我們面臨著這樣的問題:如果基本數(shù)據(jù)不再是字符數(shù)值型,而是圖像、聲音,甚至是視頻數(shù)據(jù),那我們將怎樣檢索?
7、如何表達(dá)多媒體信息的內(nèi)容?我們應(yīng)該如何組織這些數(shù)據(jù)呢?查詢應(yīng)該如何進(jìn)行?這些都是我們不得不考慮的。多媒體數(shù)據(jù)庫是數(shù)據(jù)庫技術(shù)與多媒體技術(shù)結(jié)合的產(chǎn)物。多媒體數(shù)據(jù)庫不是對現(xiàn)有的數(shù)據(jù)進(jìn)行界面上的包裝,而是從多媒體數(shù)據(jù)與信息本身的特性出發(fā),考慮將其引入到數(shù)據(jù)庫中之后而帶來的有關(guān)問題。多媒體數(shù)據(jù)庫從本質(zhì)上來說,要解決三個(gè)難題。第一是信息媒體的多樣化,不僅僅是數(shù)值數(shù)據(jù)和字符數(shù)據(jù),要擴(kuò)大到多媒體數(shù)據(jù)的存儲、組織、使用和管理。第二要解決多媒體數(shù)據(jù)集成或表現(xiàn)集成,實(shí)現(xiàn)多媒體數(shù)據(jù)之間的交叉調(diào)用和融合,集成粒度越細(xì),多媒體一體化表現(xiàn)才越強(qiáng),應(yīng)用的價(jià)值也才越大。第三是多媒體數(shù)據(jù)與人之間
8、的交互性。沒有交互性就沒有多媒體,要改