ibb娱乐彩票
上海代寫論文網專業提供代寫畢業論文、代寫本科論文服務
您現在的位置:首頁 > 管理學論文 > 圖書館論文 >
數字圖書館創作過程中數據挖掘的應用
發布時間:2020-03-18

  摘    要: 全球信息化的快速膨脹使得數字資源飛速發展,更讓有效地運用半結構化、結構化以及非結構化的繁雜數據逐漸成了圖書館工作的主導力量,在此環境下依靠圖書館資源、大量數字資源包括文獻的引證關系等,呈現出新型知識發現系統。然而由于多方面條件的限制,我國目前在該領域仍有不少問題亟待解決。基于此,本文分析了數據挖掘在數字圖書館的應用現狀,研究了數據挖掘技術在數字圖書館中的具體運用,僅供參考。

  關鍵詞: 數字圖書館; 數據挖掘; 數字資源;

  隨著經濟的飛速發展,我國在科技技術創新方面取得了優異的成果,其中在數字圖書館的數據挖掘領域發展勢頭良好。近年來,漸漸涌現出許多數字圖書館,進而逐步替代傳統模式下的圖書館。數字圖書館的問世不僅很大程度上提升了圖書館的管理效率,大大減輕了人力及物力消耗。在日常的管理過程中,數據挖掘的應用更是擔任著一個極其重要的角色,更好的填充了數字圖書館的內容。

  1 、數據挖掘的概念、內容和主要功能

  隨著網絡技術的蓬勃發展,促進數據挖掘技術發展的重要性不言而喻,這對于推動數據整合和處理工作有著極其重要的意義和幫助,尤其是在數字圖書館這一領域的運用,合理地將數據挖掘技術運用到其中,不僅可以有效地減少數據查找用時,提升效率,同時還可以完善圖書館的數據信息,便于數據的整理和篩選。從數據挖掘技術的層面考慮,它主要體現在數據信息的收集、整理,包括篩選等過程。本文的主要出發點是基于優化數據挖掘在數字圖書館中的運用展開的,將從下列幾個方面進行分析和研究。

  1.1、 數據挖掘的概念

  數據挖掘指的是在數據集里自動提取出隱含在數據里的可利用信息的過程,通常以規律、概念、本質和功能特性的方式呈現出來。它是從數據庫中知識發現的主要方法,對所篩選的信息展開分析歸納及內部規則的查找,協助使用者對以往數據以及現時數據進行分析,從中找到隱藏的規律和關系,從而推理出將來有幾率出現的事件,進而優化決策執行效果。從數字圖書館的角度來看,應用這些方法可以有效提升數據查詢效率,從而使用戶在查閱資料時能夠更加順利地展開[1]。綜合來說,它是一門多學科糅合的學科技術,主要涵蓋了數據處理學、網絡應用技術、統計學及等學科類型。為了科學合理的運用這些技術手段,對繁多的數據有效進行分析整合,基于數據處理的基礎原則界定出數據挖掘的內涵,其主要概念指的是在數據庫中搜尋出可以利用的信息資源,然后展開適當處理和運用,該方式的搜尋過程可以根據具象的名詞展開驅動查詢,主要目的就是做到對數據集合中隱含的規律、模式等進行全面的搜尋,將隱性的數據信息進行新一輪的整合和處理,轉換成對于使用者有利用價值的資源和信息,進而為使用者提供服務。

  1.2 、數據挖掘技術的內容和要求

  數據挖掘所包含內容十分廣泛,它涵蓋了基本理論、數據處理、分析方法以及定量分析和定性分析等多重內容。其核心功能指的是基于數據的屬性特征展開搜尋的過程,通常以演繹的方式呈現出來。換言之就是在數據庫的海洋中尋找對于用戶有使用價值、能夠滿足需要的基本數據。同時這些數據資源也同樣存在于數字圖書館之中,考慮到數字圖書館中的資料和數據相較繁雜,所以對于用戶來說,在使用過程中無疑要耗費大量的時間和精力去進行準備工作,數據挖掘與數字圖書館的有效結合便凸顯出了它的重要性,可以協助用戶利用數據挖掘更加快捷有效地找出對自己有用的信息資源,既提高了使用效率又節省了時間。
 

數字圖書館創作過程中數據挖掘的應用
 

  1.3 、數據挖掘技術的主要功能

  考慮到數據資源十分繁雜,基數量大,當前的數字圖書館僅有極小占比的數字資源被發掘利用,大多數的數據庫資料未能被很好的處理和整合。許多數據工作管理者因為不具備解決海量的未處理數據問題,于是對很多數據資源實行參差不齊的整合,這種模式的整合方式將會導致數據庫的持續上升和負重,從而逐漸降低使用數據的效率,對數字圖書館的使用形成了一定程度的干擾。把數據挖掘技術運用到圖書館中,可以高效地協助用戶順利地發現數據庫內有利用價值、有實際需要的數據資源,進而更好地完善自己的使用情況[2]。

  2 、分類功能

  從范圍來看,數據類別中十分重要的一個類型就是數據分類,其主要內容是通過運用函數模型兩個方面來展開對數據的優化選擇和整合,這種分類模型可以基于數據的特征以及類別來進行全面徹底地界定數據的差異,隨后根據數據類別的差異展開相對應的整合和處理,進而界定不同數據的使用功能和進行種類的界定,優化數據處理的效率;根據對數據展開類別界定可以充分有效地運用劃分類別模型,從而更全面地得出數據類別,同時還可以依據現存的數據類型來展開數據預測,對隱藏的數字信息經過關聯特征和類別進行分類;在界定數據種類的步驟過程中應當對數據進行檢測,其測試結果可交由該學科的專家來定義其類型,再依照其特征屬性給出相對應的分類函數,最終得出準確的界定和分類處理,進而更完整地對數據信息展開處理和整合。

  2.1、 回歸功能

  由于經歷過數據信息分類的過程,先前的數字信息類型即轉化為新的數字信息類型,所以要運用離散預測值來展開評定,具有離散性特征的數據主要涵蓋數字和類標號等。而在回歸功能當中許多被預推導出的數字信息均為數字量類型,并使用相繼的預測數據,在以上的類別中具備特殊的數據特征及屬性。換言之,在數據挖掘技術中通常使用預測類標號的情況均屬于分類,其根本類別均可以歸屬到預測連續數據類型。該功能核心目的是預測大多數的現有類型函數并對其加以擬合處理,然后依據函數誤差的差異得出和目標數據最為相似的數據類別,再根據任務要求展開處理和整合,進而運用于圖書館,更好地協助用戶進行優化后的數字信息查詢。

  2.2 、時間序列分析

  數據挖掘技術的基本原理是將數據進行分類,然后展開數據回歸化的演算及探究,其基本原理就是從時間序列的角度對數據展開分析,其主要過程就是建立在時間序列圖的前提上對時間序列數據展開整理,且能夠進行可視化處理[3]。它包括3項基本步驟:首先根據度量數據的序列相似度開展各種數據的分類化整合和處理;其次檢驗時間序列圖根據不同的時間序列相似來對隱含的數據展開分析,據此來界定時間序列的根本屬性;再運用歷史時間序列圖的數字資源對相關數據類型進行推測,最終提升數據庫的全面應用效率。

  2.3 、聚類

  從實際操作的層面考慮,聚類屬于數據挖掘的核心任務之一。可單獨以工具的形式獲得數據的呈現狀況,搜集每一組數據的特性,集中對特定的聚簇集合展開相繼地研究。同時還能夠作為不同算法的預處理步驟。與其他普通的技術相對比,這項功能的特性較為顯著,并且種類豐富多樣化。它所形成的簇集就是一組數據對象的匯總,這些數據對象和同一簇集中的其余數據體有著很高的相像度,但同時又和其他簇集中的對象相差甚遠。聚類分析屬于統計分析算法的一種,它源自分類學,但不等同于分類。兩者的不同之處主要是聚類需要區分的類屬于未知類別。聚類分析方法包括系統聚類法、序樣品聚類法、動態聚類法以及聚類預報法等。

  2.4 、關聯分析

  在數據挖掘所包含功能特征中,關聯分析屬于另一個較為顯著的特征,它與聚類區別很大。它是從海量數字資源中找出項集之間有相似度的聯系和有研究價值的關聯,它屬于簡單、便于實際操作的分析技術,就是發現存在于大量數據集中的關聯性或相關性,從而呈現出了在一個事件當中某些屬性一同顯示的規則和屬性。其中,關聯方法Apriori計算方法屬于挖掘產生布爾關聯規律所要用到的頻繁項集的常見計算方法,在眾多關聯規則挖掘計算方法之中倍受使用者的青睞。

  2.5、 文本挖掘技術

  文本挖掘是智能化的工具的一種,屬于數字資源挖掘領域的研究熱點之一。它通過智能算法,包括樸素貝葉斯算法、可能性推理、可視化方法、鏈接分析、文本挖掘應用等,同時還加以文字處理技術,對大量的非結構化文本源進行推算,提取或是列出關鍵信息概念和數據之間的規律,并根據具體內容對文檔進行分門別類,從中得出有利用價值的知識和數據信息[4]。

  文本挖掘屬于多門學科相互混合的技術方法,它涵蓋了多種技術手段,包括數據信息檢索、數字資源查找、語言預處理、計算語言學、統計數據分析、線性幾何、概率理論以及圖論等。

  3、 數據挖掘技術在數字圖書館中的具體應用

  3.1、 對數字圖書館的挖掘

  該項應用的主要表現形式是從網頁的結構組成和頁面鏈接之間的關系發現知識。其任務是為了搜尋出數字圖書館的網站結構及其具體的形式類別,與此同時將網頁展開聚類及分類,或者分析相關頁面,從而對其質量進行估定,改良檢索方式,為網站建設提出建議,還能夠分析學科發展現狀。

  3.2、 個性化服務

  在數字圖書館整個系統中該環節都是很重要的組成部分,通常由被動形式轉化為主動,由簡單的顯示信息轉為產生出新的信息。主要體現在兩個方面:首先按照用戶需求展開信息定制;其次是圖書館的挖掘使用者興趣模式,提供智能服務,將圖書館打造成一個智能化兼具主動化的信息供應商。

  3.3、 獲取信息速度的提升

  對于數字圖書館而言,其涵蓋的信息量是十分巨大的,在數不勝數的數字資源中蘊藏著大量的有用知識待提取。站在用戶的角度,則會關注自身需求是否能被滿足遠大于關注圖書館的信息總量。若想為用戶呈現出更快捷有效的功能,就務必具備一系列完善的搜索機制。數據挖掘技術不僅能夠給予高效的信息檢索手段和工具,其設計的系統所產生的智能特性將有更大的發揮空間。

  4、 結語

  數據挖掘技術屬于在海量數據資源中汲取可利用知識的一種新型信息技術,如今已躋身為圖書情報領域的一大研究熱點,運用數據挖掘可以為使用者提供個性化的信息服務,在數字圖書館領域的充分利用使信息資源的完善和優化又上了一個新臺階。數字圖書館所面臨的范圍早已超過了傳統模式下的圖書館所覆蓋的范疇,它能夠在網絡上儲存各類型需要保留的信息和數字資源,也能夠呈現互聯網環境中基于內容的多媒體檢索服務,還包括對文本、音影視頻和圖像等信息資源的檢索功能,讓使用者有效地使用這些信息資源。數字圖書館和數據挖掘的有機結合將逐漸達到智能化、個性化和自動化。

  參考文獻

  [1] 李飛月.基于數據挖掘的數字圖書館個性化服務研究[D].天津:天津工業大學,2013.
  [2] 陳慧敏.數據挖掘技術在數字圖書館中的應用研究[J].技術與市場,2017,24(7):168-169.
  [3] 孟玫.Web數據挖掘與高校數字圖書館個性化服務[J].電子技術與軟件工程,2017(17):183.
  [4] 陽玉堃.基于文本挖掘的社交網絡圖書館公眾形象感知研究:以新浪微博為例[J].圖書館論壇,2019,39(3):51-63.

對應分類:
版權所有:上海論文網專業權威的論文代寫、論文發表的網站,秉承信譽至上、用戶為首的服務理念,服務好每一位客戶
本站部分論文收集于網絡,如有不慎侵犯您的權益,請您及時致電或寫信告知,我們將第一時間處理,郵箱:shlunwen@163.com
ibb娱乐彩票
<meter id="7xttx"></meter>
  1. <code id="7xttx"><delect id="7xttx"><p id="7xttx"></p></delect></code>
  2. <acronym id="7xttx"></acronym>

    <address id="7xttx"></address>
    旅游| 静安区| 鄂州市| 西盟| 资阳市| 沧州市| 郑州市| 盐亭县| 祁连县| 镇雄县| 城固县| 秦安县| 竹溪县| 西和县| 盐城市| 蕲春县| 綦江县| 略阳县|