數(shù)據(jù)挖掘論文
無論在學(xué)習或是工作中,大家都接觸過論文吧,論文可以推廣經(jīng)驗,交流認識。那要怎么寫好論文呢?以下是小編整理的數(shù)據(jù)挖掘論文,供大家參考借鑒,希望可以幫助到有需要的朋友。
數(shù)據(jù)挖掘論文1
摘要:隨著科學(xué)技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘技術(shù)也應(yīng)運而生。為了高效有序的醫(yī)療信息管理,需要加強數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的實際應(yīng)用,從而提升醫(yī)院的管理水平,為醫(yī)院的管理工作及資源的合理配置提供多樣化發(fā)展的可能性。筆者將針對數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的應(yīng)用這一課題進行相應(yīng)的探究,從而提出合理的改進建議。
關(guān)鍵詞:挖掘技術(shù);醫(yī)療信息管理;應(yīng)用方式
數(shù)據(jù)挖掘作為一種數(shù)據(jù)信息再利用的有效技術(shù),能夠有效地為醫(yī)院的管理決策提供重要信息。它以數(shù)據(jù)庫、人工智能以及數(shù)理統(tǒng)計為主要技術(shù)支柱進行技術(shù)管理與決策。而在醫(yī)療信息管理過程之中應(yīng)用數(shù)據(jù)挖掘技術(shù)能夠較好地針對醫(yī)療衛(wèi)生信息進行整理與歸類來建立管理模型,形成有效的總結(jié)數(shù)據(jù)的同時能夠為醫(yī)療工作的高效進行提供有價值的信息。所以筆者將以數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的應(yīng)用為著手點,從而針對其應(yīng)用現(xiàn)狀進行探究,以此提出加強數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中應(yīng)用的具體措施,希望能夠在理論層面上推動醫(yī)療信息管理工作的飛躍。
1在醫(yī)療信息管理中應(yīng)用數(shù)據(jù)挖掘技術(shù)的基本內(nèi)涵
數(shù)據(jù)挖掘是結(jié)合信息收集技術(shù)、人工智能處理技術(shù)以及分析檢測技術(shù)等所形成的功能強大的技術(shù)。它能夠?qū)崿F(xiàn)對于數(shù)據(jù)的收集、問題的定義與處理,并且能夠較好地對于結(jié)果進行解釋與評估。在醫(yī)療信息管理工作進行的過程之中,應(yīng)用數(shù)據(jù)挖掘技術(shù)可以較好地加強醫(yī)療信息數(shù)據(jù)模型的建立,同時以多種形式出現(xiàn),例如文字信息、基本信號信息、圖像收集等,也能夠用來進行醫(yī)療信息的科普與宣傳。并且,數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息中所體現(xiàn)出的應(yīng)用方式有所不同,在數(shù)據(jù)挖掘技術(shù)應(yīng)用過程之中,既可以針對同一類的實物反應(yīng)出共同性質(zhì)的基本特征,同時也能夠根據(jù)具有一定關(guān)聯(lián)性的事物信息來探究差異。這些功能不僅僅能夠在醫(yī)療信息的管理層面上給予醫(yī)療人員較大的信息管理指導(dǎo),同時在實際的醫(yī)療診斷過程之中,也可以向醫(yī)生提供患者的患病信息,并且輔助治療的進行[1]。所以,在醫(yī)療信息管理中應(yīng)用數(shù)據(jù)挖掘技術(shù)不僅僅能夠推動醫(yī)療信息管理水平的提升,也是醫(yī)院實現(xiàn)現(xiàn)代化、信息化建設(shè)的重要體現(xiàn),需要從根本上明確醫(yī)療信息管理應(yīng)用數(shù)據(jù)挖掘技術(shù)的必要性與基本內(nèi)涵,從而針對醫(yī)院的管理現(xiàn)狀實現(xiàn)其管理方式與技術(shù)應(yīng)用的轉(zhuǎn)變與優(yōu)化。
2在醫(yī)療信息管理過程之中加強數(shù)據(jù)挖掘技術(shù)應(yīng)用的重要措施
2.1實現(xiàn)建模環(huán)節(jié)以及數(shù)據(jù)收集環(huán)節(jié)的優(yōu)化
在應(yīng)用數(shù)據(jù)挖掘技術(shù)的過程之中,必須基于數(shù)據(jù)庫信息的基礎(chǔ)之上,其數(shù)據(jù)挖掘技術(shù)才能夠進行相應(yīng)的規(guī)律探究與信息分析,所以需要在源頭處加強數(shù)據(jù)收集環(huán)節(jié)以及建模環(huán)節(jié)的優(yōu)化。以醫(yī)院中醫(yī)部門為例,在對于中醫(yī)處方經(jīng)驗的挖掘方法使用過程之中,需要針對不同的藥物進行關(guān)聯(lián)性建模,比如數(shù)據(jù)庫中有基礎(chǔ)性藥物,針對藥物進行頻數(shù)和次數(shù)的統(tǒng)計,然后以此類推,將所有藥物都按照出現(xiàn)的頻數(shù)進行降數(shù)排列,從而探究參考價值。建模環(huán)節(jié)以及數(shù)據(jù)收集環(huán)節(jié)是醫(yī)療信息管理過程的根本,所以需要做好對于建模環(huán)節(jié)以及數(shù)據(jù)收集環(huán)節(jié)的優(yōu)化,才能夠為數(shù)據(jù)挖掘技術(shù)的應(yīng)用奠定相應(yīng)的基礎(chǔ)[2]。
2.2細化數(shù)據(jù)挖掘技術(shù)應(yīng)用類別
想要在醫(yī)療信息管理過程之中,加強對于數(shù)據(jù)挖掘技術(shù)的有效應(yīng)用,就需要從數(shù)據(jù)挖掘技術(shù)應(yīng)用類別處進行著手,從而提升技術(shù)應(yīng)用的針對性與有效性。常見的技術(shù)應(yīng)用類別有:醫(yī)院資源配置方面、病患區(qū)域管理方面、醫(yī)療衛(wèi)生質(zhì)量管理方面、醫(yī)療急診管理方面、醫(yī)院經(jīng)濟管理方面以及醫(yī)療衛(wèi)生常見病宣傳方面等,數(shù)據(jù)挖掘技術(shù)都可以在這些類別之中實現(xiàn)應(yīng)用,但是在應(yīng)用的.過程之中也有所不同。以病房區(qū)域管理為例,在應(yīng)用數(shù)據(jù)挖掘技術(shù)之前,首先需要明確不同的科室狀況以及病房區(qū)域分配狀況等,加強病患區(qū)域的指標分析,因為病房管理不僅僅影響到科室的工作效率與工作效果,同時也是醫(yī)療物資分配與人員編制的主要參考標準。其次利用數(shù)據(jù)挖掘技術(shù)能夠較好地實現(xiàn)不同科室工作效率、質(zhì)量管理質(zhì)量以及經(jīng)濟收益等多種指標的評估,建立其科室的運營模型,從而實現(xiàn)科室的又好又快發(fā)展。比如使用數(shù)據(jù)挖掘技術(shù)建立其病區(qū)管理的標準模型以及統(tǒng)計指標,從而計算出科室動態(tài)的工作模型以及病床動態(tài)的周轉(zhuǎn)次數(shù)等[3]。另外在醫(yī)療質(zhì)量管理過程之中,數(shù)據(jù)挖掘技術(shù)提供的不僅僅是資料數(shù)據(jù)的參考以及疾病的診斷,也能夠針對臨床的治療效果進行分析與評價,并且能夠預(yù)測治療狀況:可以利用醫(yī)院的醫(yī)療數(shù)據(jù)庫,對于病人的基本患病信息進行分類,從而比對死亡率、治愈率等多個數(shù)據(jù),實現(xiàn)治療方案的制訂。而在醫(yī)療質(zhì)量管理過程之中也有很多的影響因素,例如基礎(chǔ)醫(yī)療設(shè)備、病床周轉(zhuǎn)次數(shù)、病種治愈記錄等,所以也可以利用數(shù)據(jù)挖掘技術(shù)來進一步加強其多種數(shù)據(jù)之間的關(guān)聯(lián)性,從而為提升醫(yī)院的社會效益與經(jīng)濟效益提出合理的參考性建議。
2.3明確數(shù)據(jù)挖掘技術(shù)的應(yīng)用方向
醫(yī)院加強數(shù)據(jù)挖掘技術(shù)應(yīng)用方向的探索上,可以從客戶拓展這個角度出發(fā)實現(xiàn)對于醫(yī)療信息管理。例如通過數(shù)據(jù)挖掘技術(shù)多方進行患者信息比對,同時制訂完善的醫(yī)療服務(wù)影響策略方式,加強對于客戶行為的分析;在數(shù)據(jù)挖掘的基礎(chǔ)之上,增強其技術(shù)應(yīng)用的實用性,在分析的基礎(chǔ)之上比對自身的競爭優(yōu)勢,實現(xiàn)醫(yī)院資源的合理規(guī)劃與合理配置,例如藥品、資金以及疾病診斷等,從而實現(xiàn)經(jīng)營狀況的優(yōu)化。目前醫(yī)院也逐步向現(xiàn)代化、信息化方向發(fā)展,無論是信息管理還是醫(yī)療技術(shù)方面,醫(yī)院都已經(jīng)成為了一個信息化的綜合行業(yè)體系,所以在加強數(shù)據(jù)挖掘應(yīng)用的過程之中,還需要加強數(shù)據(jù)信息的管理,實現(xiàn)數(shù)據(jù)挖掘結(jié)果的維護,從而提升醫(yī)院的決策能力,實現(xiàn)數(shù)據(jù)挖掘技術(shù)的高效應(yīng)用。
3結(jié)語
醫(yī)院在目前的醫(yī)療信息管理過程之中,還有很大的發(fā)展空間,需要綜合利用數(shù)據(jù)挖掘技術(shù),實現(xiàn)其信息管理水平的提升。通過明確數(shù)據(jù)挖掘技術(shù)的應(yīng)用方向、應(yīng)用類別以及建模數(shù)據(jù)環(huán)節(jié)的優(yōu)化等,促進醫(yī)院管理水平的提升,實現(xiàn)數(shù)據(jù)挖掘技術(shù)應(yīng)用效果的提升.
參考文獻:
[1]鄭勝前.數(shù)據(jù)挖掘技術(shù)在社區(qū)醫(yī)療服務(wù)系統(tǒng)中的應(yīng)用與研究[J].數(shù)字技術(shù)與應(yīng)用,20xx(09):81-82.
[2]廖亮.數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的應(yīng)用[J].中國科技信息,20xx(11):54,56.
[3]牟勇.數(shù)據(jù)挖掘技術(shù)在醫(yī)院信息化系統(tǒng)中應(yīng)用[J].電子測試,20xx(11):23-24,22.
數(shù)據(jù)挖掘論文2
摘要:數(shù)據(jù)挖掘是指從海量數(shù)據(jù)中找到人們未知、可能有用的、隱藏的規(guī)則,可以通過關(guān)聯(lián)分析、聚類分析、時序分析等各種算法發(fā)現(xiàn)一些無法通過觀察圖表得出的深層次原因。將計算機數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校學(xué)籍預(yù)警機制的研究中,在大量以往的教學(xué)管理數(shù)據(jù)庫中挖掘出未知、可能有用的、隱藏的規(guī)則,促進教育的改革和發(fā)展。
關(guān)鍵詞:數(shù)據(jù)挖掘;DataMining;學(xué)籍預(yù)警機制
本文針對學(xué)分制背景下高校學(xué)籍預(yù)警機制存在的問題和現(xiàn)狀,用計算機數(shù)據(jù)挖掘(DataMining)技術(shù)對學(xué)籍預(yù)警機制進行分析,通過數(shù)據(jù)挖掘有關(guān)方法對搜集到的學(xué)生學(xué)籍數(shù)據(jù)進行分析和處理,以求能夠挖掘出大量的隱含在學(xué)籍信息系統(tǒng)中的有價值的資源,用以預(yù)測可能發(fā)生的預(yù)警事件,為教學(xué)管理者進行危機管理提供幫助。隨著高校招生規(guī)模不斷擴大,如何保證高校的教學(xué)質(zhì)量最終完成人才培養(yǎng)方案,成為一個重要的問題,具有重要研究價值。
一、高校學(xué)籍預(yù)警機制的現(xiàn)狀及問題
20xx年8月教育部對“學(xué)籍預(yù)警”這一詞語做出了解釋:是一種高等教育管理方式。普通高校學(xué)籍的預(yù)警方式一般采用學(xué)校和院系雙向管理,學(xué)校負責統(tǒng)一制定學(xué)籍預(yù)警標準,通過學(xué)習進度推進的不同階段劃分學(xué)分預(yù)警標準,在達到一定學(xué)分線開始預(yù)警,分為考勤預(yù)警、選課預(yù)警、成績預(yù)警、學(xué)籍異動預(yù)警、畢業(yè)預(yù)警。根據(jù)高校教學(xué)管理系統(tǒng),對缺課達到一定數(shù)目的學(xué)生進行提醒教育,期末統(tǒng)計學(xué)生完成的學(xué)分來評估學(xué)生學(xué)習情況,并預(yù)測學(xué)生是否能夠完成培養(yǎng)方案,通過教師提供的學(xué)生考勤記錄、作業(yè)情況以及課堂表現(xiàn)等,針對學(xué)生的具體情況對其預(yù)警。教學(xué)考核工作與學(xué)生思想政治工作在學(xué)生管理方面相對獨立,主要是事先警示教育、事后跟蹤管理。目前的學(xué)籍預(yù)警主要是單方向的,原有的學(xué)籍管理制度大都是傳統(tǒng)的事后處理型,具有延遲性。只有出現(xiàn)嚴重的學(xué)籍異常后,才會觸發(fā)預(yù)警機制,采取相應(yīng)的對策解決問題,家長對學(xué)生的在校學(xué)習情況了解不清,了解不及時,比如之前學(xué)期表現(xiàn)良好的學(xué)生本學(xué)期出現(xiàn)網(wǎng)癮狀態(tài)而不能及時發(fā)現(xiàn),往往會錯過對該生的最佳教育期。傳統(tǒng)的學(xué)籍預(yù)警機制無法做到提前預(yù)知,對學(xué)生的學(xué)習和生活狀況無法實時監(jiān)管,問題的根源也無法追蹤。
二、數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘(DataMining)是指從海量數(shù)據(jù)中找到人們未知的、可能有用的、隱藏的規(guī)則,可以通過關(guān)聯(lián)分析、聚類分析、時序分析等各種算法發(fā)現(xiàn)一些無法通過觀察圖表得出的深層次原因。因此,將計算機數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校學(xué)籍預(yù)警機制的研究中,在大量以往的教學(xué)管理數(shù)據(jù)庫中挖掘出未知的、可能有用的、隱藏的規(guī)則,促進教育的改革和發(fā)展。將計算機數(shù)據(jù)挖掘技術(shù)和傳統(tǒng)的人力管理相結(jié)合,以學(xué)生為本,建立健全全方位學(xué)籍預(yù)警構(gòu)架,做到“防微杜漸”,為學(xué)校順利完成教育目標起到促進作用。
三、數(shù)據(jù)挖掘在學(xué)籍預(yù)警機制里的應(yīng)用
隨著計算機技術(shù)的進步,各大高校逐步建立了日益完善的學(xué)籍信息管理系統(tǒng),累積了大量學(xué)籍信息數(shù)據(jù)庫。目前,這些數(shù)據(jù)主要用來向各級管理部門上報和學(xué)校自行查看存檔,但對于這些數(shù)據(jù)后面隱藏的價值并沒有進行深度挖掘和利用,十分可惜。所以,應(yīng)以高校學(xué)生信息管理系統(tǒng)為對象,研究深度數(shù)據(jù)挖掘的方法,“透過現(xiàn)象看本質(zhì)”,綜合分析出有價值的學(xué)籍預(yù)警信息,為管理提供參考。例如,學(xué)校發(fā)現(xiàn)高等數(shù)學(xué)等主干課的不及格率有逐年上升的趨勢,一般認為是學(xué)習不認真所致,但做了很多工作效果并不明顯,這時通過數(shù)據(jù)挖掘分析挖掘最近10年所有有過不及格課程的學(xué)生的成績,發(fā)現(xiàn)有較高比例的.學(xué)生來自西部地區(qū),而且還發(fā)現(xiàn)有較高比例的學(xué)生家庭收入非常高或者非常低(生源地和經(jīng)濟情況問題)。針對此可以在學(xué)生管理上提前采取有針對性的管理措施。制定好目標標準,挖掘?qū)W生的學(xué)習習慣及學(xué)習特長,輔助教師指導(dǎo)學(xué)生,指導(dǎo)學(xué)生改正自己的不當行為,提高學(xué)習能力。從教學(xué)管理系統(tǒng)中所記載的學(xué)生基本資料、學(xué)習成績、學(xué)習經(jīng)歷、學(xué)習喜好以及知識體系結(jié)構(gòu)等內(nèi)容,發(fā)現(xiàn)學(xué)生學(xué)習習慣,輔助學(xué)生改正自身學(xué)習行為。提高學(xué)生各方面綜合素質(zhì)。利用數(shù)據(jù)挖掘的關(guān)聯(lián)分析輔助師生行為預(yù)警干預(yù)。各高校學(xué)籍管理系統(tǒng)中記載著各院系各專業(yè)學(xué)生與教師的學(xué)習工作,社會活動,獎勵處罰情況,可從中分析出師生各種活動之間的內(nèi)在聯(lián)系,假定有規(guī)則“A∪B∈C”,那么當在實際活動中,某學(xué)生已有A和B行為,馬上可以分析出產(chǎn)生下個行為的概率,可即時預(yù)警,提前制止C行為的發(fā)生。利用數(shù)據(jù)挖掘為課程設(shè)置提供合理依據(jù)。高校學(xué)生的課程安排設(shè)置是循序漸進的,每門課程之間都有一定的關(guān)聯(lián)和前后順序,在學(xué)習一門專業(yè)課程之前必須先修一門基礎(chǔ)課程,基礎(chǔ)知識沒學(xué)好勢必影響專業(yè)課程的學(xué)習。而且,同一年級不同專業(yè)學(xué)生之間,由于教師或教師專業(yè)背景知識不同,各個學(xué)生總體成績相差有時會很大。數(shù)據(jù)庫中記載著以往各專業(yè)學(xué)生各學(xué)科考試成績,使用數(shù)據(jù)挖掘的關(guān)聯(lián)分析與時序分析技術(shù),能分析出原因,在此基礎(chǔ)上對課程進行合理設(shè)置。
綜上所述,將基于計算機數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校的教學(xué)管理,以提高教學(xué)管理的預(yù)知性,增加教法選擇的參考性,加強教學(xué)過程的指導(dǎo)性,提高教學(xué)質(zhì)量。
參考文獻:
[1]陳東民,等.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)[M].北京:北京電子工業(yè)出版社,20xx
[2]楊悅.數(shù)據(jù)挖掘在高校招生工作中的應(yīng)用前景[J].教育科學(xué),20xx
[3]胡侃.基于大型數(shù)據(jù)倉庫的數(shù)據(jù)采掘[J].軟件學(xué)報,1998
數(shù)據(jù)挖掘論文3
摘要:橡膠是一種重要的戰(zhàn)略物資, 其種植受到土地資源、地理環(huán)境、橡膠機械化的影響, 產(chǎn)量波動很大。本文對農(nóng)墾橡膠產(chǎn)業(yè)種植、生產(chǎn)加工引入數(shù)據(jù)挖掘技術(shù)的必要性進行了初步探究, 指出通過提取土壤圖像的特征, 用支持向量機的算法可以發(fā)現(xiàn)橡膠種植、生產(chǎn)加工的規(guī)律, 進而制定精準的橡膠產(chǎn)業(yè)相關(guān)策略, 以提高橡膠產(chǎn)量、節(jié)約成本、提高利潤。
關(guān)鍵詞:橡膠種植; 數(shù)據(jù)挖掘; 特征提取; 支持向量機.
基金:廣東農(nóng)工商職業(yè)技術(shù)學(xué)院校級課題“基于數(shù)據(jù)挖掘技術(shù)的橡膠產(chǎn)業(yè)的數(shù)字化研究” (xykt1601)橡膠是一種重要的戰(zhàn)略物資, 與石油、鋼鐵、煤炭并稱為四大工業(yè)原料。我國是全球最大的天然橡膠消費國和進口國, 國內(nèi)天然橡膠長期處于缺口狀態(tài), 需求的2/3依賴進口來滿足[1]。天然橡膠產(chǎn)業(yè)屬于資源約束型、勞動密集型產(chǎn)業(yè), 相對其他農(nóng)作物來說, 具有周期長、收益長等特點。農(nóng)墾橡膠業(yè)的產(chǎn)生、發(fā)展與壯大實際上是中國橡膠業(yè)發(fā)展的一個縮影, 一直是學(xué)術(shù)界研究的熱點。根據(jù)農(nóng)墾橡膠產(chǎn)業(yè)種植、生產(chǎn)加工的歷史數(shù)據(jù)進行數(shù)據(jù)挖掘, 發(fā)現(xiàn)其種植、生產(chǎn)加工的規(guī)律, 進而制定精準的橡膠產(chǎn)業(yè)相關(guān)策略, 以提高橡膠產(chǎn)量、節(jié)約成本、提高利潤的數(shù)字化研究, 目前國內(nèi)還比較少。
1 引入數(shù)據(jù)挖掘技術(shù)的必要性
天然橡膠以其獨具的高彈性、高強度、高伸長率、耐磨、耐撕裂、耐沖擊、耐酸堿、耐油、耐腐蝕、耐高低溫和絕緣性好、粘合性、密封性強等特點, 始終處于不可替代的地位。我國天然橡膠需求量大, 近幾年一直處于供不應(yīng)求的狀態(tài)。造成這種局面的原因主要有以下兩點:一、國內(nèi)輪胎工業(yè)迅猛發(fā)展;二、天然橡膠的種植條件苛刻。其種植條件苛刻主要體現(xiàn)在對種植地要求高, 如對土地的含碳、含氮、濕度等要求都很嚴格;容易受到寒害、蟲害、臺風的襲擊。橡膠的'供應(yīng)不足阻礙了我國經(jīng)濟 (特別是輪胎行業(yè)) 的發(fā)展;诖吮尘跋, 本文通過數(shù)據(jù)挖掘技術(shù)對橡膠樹生長地的土壤進行評價研究, 為尋找出最適合橡膠樹生長的土壤和尋找橡膠樹種植地提供依據(jù), 一方面可以降低種植橡膠的成本, 另一方面可以讓新的橡膠農(nóng)更容易掌握種植橡膠技巧, 讓更多的人加入種植橡膠的隊伍中。
2 數(shù)字化流程圖
2.1 樣本采集
研究的橡膠林可以分為4種不同林齡膠林:幼林早期 (0~2齡) 、幼林晚期 (2~7齡) 、開割數(shù) (7~16齡) 、老齡即將更新數(shù) (>16齡) 。取土壤樣本的時間要在晴天上午, 如果遇雨天, 則等2個晴天后再進行取樣。每個林齡段中隨機設(shè)置n個樣地:每個樣地的面積a (m) ×b (m) , 分0~15cm、15~30cm、30~45cm、45~60cm4個層次拍攝土壤樣品, 每個層次拍攝m張。每張土壤樣品圖片的命名規(guī)則為“膠林-層次.jpg”。
2.2 特征提取
通過拍攝得到的土壤圖像, 由于圖像的維度過大, 不容易分析, 需要從中提取土樣圖像的特征, 提取反應(yīng)圖像本質(zhì)的一些關(guān)鍵指標, 以達到自動進行圖像識別的目的。
圖像的特征主要包括顏色特征、紋理特征、形狀特征等。本文主要運用圖片的顏色特征和紋理特征建立圖片自動識別模型。
2.2.1 顏色特征
圖片的顏色特征用顏色矩表示;陬伾靥崛D像特征的數(shù)學(xué)基礎(chǔ)在于圖像中任何的顏色分布均可以用它的矩來表示。顏色的矩包含各個顏色通道的一階矩、二階矩和三階矩, 對于一幅RGB顏色空間的圖像, 具有R、G和B三個顏色通道, 共有9個分量。
2.2.2 紋理特征
圖片的紋理特征主要灰度共生矩陣里面中提取。因為紋理是由灰度分布在空間位置上反復(fù)交替變化而形成的, 因而在圖像空間中相隔某距離的兩個像素間一定存在一定的灰度關(guān)系, 稱為是圖像中灰度的空間相關(guān)特性。
其中L表示圖像的灰度級, i, j分別表示像素的灰度。d表示兩個像素間的空間位置關(guān)系。不同的d決定了兩個像素間的距離和方向。元素Pd (1, 0) 代表了圖像上位置關(guān)系為d的兩個像素灰度分別為1和0的情況出現(xiàn)的次數(shù)。
在建模中一般不直接用圖片的灰度共生矩陣建模, 往往要從灰度共生矩陣中提取它的特征參數(shù)用戶建模;叶裙采仃嚨奶卣鲄(shù)有二階距、對比度、相關(guān)、熵。
3 模型構(gòu)建
特征提取完之后, 用支持向量機算法對圖像進行圖片識別。根據(jù)識別出的結(jié)果就可以有針對性的對土壤做些有利于橡膠樹生長的干預(yù)工作, 如:如果識別出土壤缺少氮元素, 可以給土壤適當?shù)氖┬┑?如果識別出土壤的水分較少, 就要給土壤澆水, 給農(nóng)墾橡膠產(chǎn)業(yè)提供數(shù)學(xué)指導(dǎo)意義。
4 結(jié)論
本文分析了橡膠種植中引入數(shù)據(jù)挖掘技術(shù)的必要性, 對橡膠種植數(shù)字化研究做了初步闡述?梢越o橡膠業(yè)提供一定的參考意義。
參考文獻
[1]黃冠, 吳紅宇.廣東農(nóng)墾天然橡膠種植現(xiàn)狀及“走出去”戰(zhàn)略實踐.中國熱帶農(nóng)業(yè), 20xx, 3 (4) , 18-21.
[2]李煒.廣東農(nóng)墾“走出去”做強做大橡膠產(chǎn)業(yè).今日熱作, 20xx, 19 (1) , 52-53.
[3]Rapepun Wititsuwannakul, Piyaporn Pasitkul, et.al.Hevea latex lectin binding protein in C-serum as an anti-latex coagulating factor and its role in a proposed new model for latex coagulation, Phytochemistry 20xx, 69 (1) , 656–662.
[4]勒碧.數(shù)據(jù)挖掘算法及其生產(chǎn)優(yōu)化應(yīng)用中的研究.浙江大學(xué)碩士學(xué)位論文, 20xx.
數(shù)據(jù)挖掘論文4
一、在對計算機病毒數(shù)據(jù)庫的數(shù)據(jù)挖掘方面存在的問題和局限
1.1對計算機病毒數(shù)據(jù)庫的數(shù)據(jù)挖掘技術(shù)有限
據(jù)有關(guān)調(diào)查,目前的信息技術(shù)行業(yè)對計算機病毒數(shù)據(jù)庫的數(shù)據(jù)挖掘在技術(shù)方面還是存在局限與問題的;從客觀層面上來講,沒有哪一種計算機的技術(shù)可以完全杜絕或制止計算機病毒對計算機數(shù)據(jù)庫的侵入和威脅,這種糟糕情況的出現(xiàn),不僅給單個計算機的系統(tǒng)造成損害,而且給整個計算機技術(shù)行業(yè)在某些時候也會造成不必要的損失和危害。所以說,開創(chuàng)有關(guān)減弱甚至是消滅計算機病毒數(shù)據(jù)庫的計算機技術(shù)就顯得尤為重要。
1.2對計算機病毒數(shù)據(jù)庫的數(shù)據(jù)挖掘效率極低
我們都知道,可以利用相應(yīng)的計算機技術(shù)來對計算機病毒數(shù)據(jù)庫的數(shù)據(jù)進行挖掘,但是就目前而言,單一而又較為簡單的計算機技術(shù)很難高效地對數(shù)據(jù)進行挖掘,只能夠從具有病毒的數(shù)據(jù)庫中挖掘出極少數(shù)數(shù)據(jù)甚至是挖掘不出來。所以說,提高計算機病毒數(shù)據(jù)庫的數(shù)據(jù)挖掘效率也就顯得尤為重要。
1.3對計算機病毒數(shù)據(jù)庫的數(shù)據(jù)挖掘成本較高
值得注意的是,某些計算機病毒數(shù)據(jù)庫中的數(shù)據(jù)是值得使用和發(fā)揮作用的,所以,計算機行業(yè)的某些操作人員就會盡可能采用多種渠道和方法來對有用的數(shù)據(jù)進行挖掘和分析,這樣一來,通;ㄙM的成本就會相對地高,不免也就會給某些企業(yè)造成沉重的負擔。所以說,降低對計算機病毒數(shù)據(jù)庫的數(shù)據(jù)挖掘成本就顯得尤為重要了。
二、計算機病毒數(shù)據(jù)庫的數(shù)據(jù)挖掘的策略與方法
2.1實施相應(yīng)的計算機病毒監(jiān)控技術(shù)
如何進一步地減弱計算機病毒對計算機數(shù)據(jù)庫的侵入和威脅,我們需要慎重考慮,而實施相應(yīng)的計算機病毒監(jiān)控技術(shù)已成為此時的無疑之策;進一步來說,就是設(shè)置多種監(jiān)控技術(shù),例如設(shè)置內(nèi)存監(jiān)控,配備相應(yīng)的文件監(jiān)控,還有就是注冊不同的表監(jiān)控等等,這些都是有效地減弱甚至是防止計算機病毒侵襲數(shù)據(jù)庫的監(jiān)控技術(shù)?傊覀兺ㄟ^這些技術(shù),就會盡可能的從計算機病毒數(shù)據(jù)庫中挖掘出需要的數(shù)據(jù)。
2.2配置適當?shù)挠嬎銠C病毒源的追蹤設(shè)備
據(jù)有關(guān)部門調(diào)查,目前使用較為有效的計算機病毒源的追蹤設(shè)備就是郵件追蹤設(shè)備,它能夠有效地通過相應(yīng)的消息或指令來對計算機的查詢進行追蹤,這樣就能夠高效地檢測出是否有計算機病毒侵入。依據(jù)這種情況,我們可以進一步開拓思維,尤其是計算機行業(yè)的管理員和操作人員,更應(yīng)該為計算機設(shè)計出以及配置適當?shù)牟煌挠嬎銠C病毒源的追蹤設(shè)備,從而使人們在計算機病毒侵入數(shù)據(jù)庫的情況下,仍然能夠得到自己想要的`正常數(shù)據(jù)。
2.3設(shè)置獨特的計算機反病毒數(shù)據(jù)庫
所謂的計算機反病毒數(shù)據(jù)庫,就是在計算機操作系統(tǒng)的底部值入反病毒的指令或程序,讓它成為計算機系統(tǒng)內(nèi)部數(shù)據(jù)庫的底層模塊,而不是計算機系統(tǒng)外部的某種軟件。這樣一來,當計算機的病毒侵入系統(tǒng)內(nèi)數(shù)據(jù)庫時,就會被底層的反病毒程序代碼或指令反攻出來,就進一步達到了減弱甚至消除計算機病毒對計算機數(shù)據(jù)庫的侵襲和威脅的目的,那么我們這時就可以挖掘出必需的數(shù)據(jù)了。
三、結(jié)束語
概而言之,就現(xiàn)在的計算機病毒來說,可謂是呈現(xiàn)日益猖獗的態(tài)勢;也就是說,計算機技術(shù)迅速發(fā)展了,計算機病毒也就會跟其迅速“發(fā)展”。我們想要有效地遏制住計算機病毒,從計算機病毒數(shù)據(jù)庫中挖掘出必需的數(shù)據(jù),對于普通人來說就應(yīng)該多多了解一些預(yù)防計算機病毒侵入的知識;而對于計算機行業(yè)的管理員或操作人員來說,就應(yīng)該多設(shè)計出一些遏制計算機病毒侵襲的軟件或方案,從而使我們的計算機環(huán)境更干凈,更安全。
數(shù)據(jù)挖掘論文5
1理論研究
1.1客戶關(guān)系管理
客戶關(guān)系管理的目標是依靠高效優(yōu)質(zhì)的服務(wù)吸引客戶,同時通過對業(yè)務(wù)流程的全面優(yōu)化和管理,控制企業(yè)運行成本。客戶關(guān)系管理是一種管理理念,將企業(yè)客戶視作企業(yè)發(fā)展最重要的企業(yè)資源,采用企業(yè)服務(wù)優(yōu)化等手段來管理客戶關(guān)系?蛻絷P(guān)系管理并不是單純的信息技術(shù)或者管理技術(shù),而是一種企業(yè)生物戰(zhàn)略,通過對企業(yè)客戶的分段充足,強化客戶滿意的行為,優(yōu)化企業(yè)可盈利性,將客戶處理工作上升到企業(yè)級別,不同部門負責與客戶進行交互,但是整個企業(yè)都需要向客戶負責,在信息技術(shù)的支持下實現(xiàn)企業(yè)和客戶連接環(huán)節(jié)的自動化管理。
1.2客戶細分
客戶細分由美國學(xué)者溫德爾史密斯在20世紀50年代提出,認為客戶細分是根據(jù)客戶屬性將客戶分成集合,F(xiàn)代營銷學(xué)中的客戶細分是按照客戶特征和共性將客戶群分為不同等級或者子群體,尋找相同要素,對不同類別客戶心理與需求急性研究和評估,從而指導(dǎo)進行企業(yè)服務(wù)資源的分配,是企業(yè)獲得客戶價值的一種理論與方法。因此我們注意到,客戶細分其實是一個分類問題,但是卻有著顯著的特點。
1.2.1客戶細分是動態(tài)的企業(yè)不斷發(fā)展變化,用戶數(shù)據(jù)不斷積累,市場因素的變化,都會造成客戶細分的變化。所以客戶細分工作需要根據(jù)客戶情況的變化進行動態(tài)調(diào)整,
減少錯誤分類,提高多次細分中至少有一次是正確分類的可能性。
1.2.2受眾多因素影響
隨著時間的推移,客戶行為和心理會發(fā)生變化,所以不同時間的數(shù)據(jù)會反映出不同的規(guī)律,客戶細分方法需要在變化過程中準確掌握客戶行為的規(guī)律性。
1.2.3客戶細分有不同的分類標準
一般分類問題強調(diào)準確性,客戶關(guān)系管理則強調(diào)有用性,講求在特定限制條件下實現(xiàn)特定目標。
1.3數(shù)據(jù)挖掘
數(shù)據(jù)挖掘就是從大型數(shù)據(jù)庫數(shù)據(jù)中提取有價值的、隱含的、事前未知的潛在有用信息。數(shù)據(jù)挖掘技術(shù)不斷發(fā)展,挖掘?qū)ο蟛辉偈菃我粩?shù)據(jù)庫,已經(jīng)逐漸發(fā)展到文件系統(tǒng)、數(shù)據(jù)集合以及數(shù)據(jù)倉庫的挖掘分析。
2客戶細分的數(shù)據(jù)挖掘
2.1邏輯模型
客戶數(shù)據(jù)中有著若干離散客戶屬性和連續(xù)客戶屬性,每個客戶屬性為一個維度,客戶作為空間點,全部客戶都能夠形成多為空間,作為客戶的屬性空間,假設(shè)A={A1,A2,…Am}是一組客戶屬性,屬性可以是連續(xù)的,也可以離散型,這些屬性就形成了客戶m維屬性空間。同時設(shè)g是一個描述客戶屬性的'一個指標,f(g)是符合該指標的客戶集合,即為概率外延,則任一確定時刻都是n個互不相交集合。在客戶價值概念維度上,可分為“有價值客戶”“潛在價值客戶”“無價值客戶”三種類型,定義RB如下:(1)顯然RB是一個等價關(guān)系,經(jīng)RB可分類屬性空間為若干等價類,每個等價類都是一個概念類,建立客戶細分,就是客戶屬性空間和概念空間映射關(guān)系的建立過程。
2.2客戶細分數(shù)據(jù)挖掘?qū)嵤?/p>
通過數(shù)據(jù)庫已知概念類客戶數(shù)據(jù)進行樣本學(xué)習和數(shù)據(jù)挖掘,進行客戶屬性空間與概念空間映射的自動歸納。首先確定一組概念類已知客戶集合。首先確定一個映射:p:C→L,使,如果,則。,求p(c)確定所屬概念類。數(shù)據(jù)部分有客戶數(shù)據(jù)存儲和概念維數(shù)據(jù)構(gòu)成,客戶數(shù)據(jù)存儲有企業(yè)全部內(nèi)在屬性、外在屬性以及行為屬性等數(shù)據(jù),方法則主要有關(guān)聯(lián)規(guī)則分析、深井網(wǎng)絡(luò)分類、決策樹、實例學(xué)習等數(shù)據(jù)挖掘方法,通過對客戶數(shù)據(jù)存儲數(shù)據(jù)學(xué)習算法來建立客戶數(shù)據(jù)和概念維之間的映射關(guān)系。
2.3客戶細分數(shù)據(jù)分析
建立客戶動態(tài)行為描述模型,滿足客戶行為非確定性和非一致性要求,客戶中心的管理體制下,客戶細分影響企業(yè)戰(zhàn)術(shù)和戰(zhàn)略級別決策的生成,所以數(shù)據(jù)挖掘要能夠彌補傳統(tǒng)數(shù)據(jù)分析方法在可靠性方面的缺陷。
2.3.1客戶外在屬性
外在屬性有客戶地理分布、客戶組織歸屬情況和客戶產(chǎn)品擁有情況等?蛻舻慕M織歸屬是客戶社會組織類型,客戶產(chǎn)品擁有情況是客戶是否擁有或者擁有哪些與其他企業(yè)或者其他企業(yè)相關(guān)產(chǎn)品。
2.3.2內(nèi)在屬性
內(nèi)在屬性有人口因素和心理因素等,人口因素是消費者市場細分的重要變量。相比其他變量,人口因素更加容易測量。心理因素則主要有客戶愛好、性格、信用情況以及價值取向等因素。
2.3.3消費行為
消費行為屬性則重點關(guān)注客戶購買前對產(chǎn)品的了解情況,是客戶細分中最客觀和重要的因素。
2.4數(shù)據(jù)挖掘算法
2.4.1聚類算法
按照客戶價值標記聚類結(jié)果,通過分類功能,建立客戶特征模型,準確描述高價值客戶的一些特有特征,使得企業(yè)在之后的市場活動中能夠迅速發(fā)現(xiàn)并抓住類似的高價值客戶,全面提高客戶的整體價值水平。通常都采用中心算法進行客戶的聚類分析,分析涉及的字段主要有客戶的基本信息以及與客戶相關(guān)業(yè)務(wù)信息,企業(yè)采用中心算法,按照企業(yè)自身的行業(yè)性質(zhì)以及商務(wù)環(huán)境,選擇不同的聚類分析策略,有主屬性聚類分析和全屬性聚類分析兩類。主屬性聚類分析是企業(yè)根據(jù)在企業(yè)標度變量中選擇主要弧形作為聚類分析變量。通常區(qū)間標度變量選用的度量單位會對聚類分析結(jié)果產(chǎn)生很大影響,選擇的度量單位越小,就會獲得越大的可能值域,對聚類結(jié)果的影響也就越大。
2.4.2客戶分析預(yù)測
行業(yè)競爭愈加激烈,新客戶的獲得成本越來越高,在保持原有工作價值的同時,客戶的流失也受到了企業(yè)的重視。為了控制客戶流失,就需要對流失客戶的數(shù)據(jù)進行認真分析,找尋流失客戶的根本原因,防止客戶的持續(xù)流失。數(shù)據(jù)挖掘聚類功能同樣能夠利用在客戶流失數(shù)據(jù)分析工作中,建立基于流失客戶數(shù)據(jù)樣本庫的分類函數(shù)以及分類模式,通過模型分析客戶流失因素,能夠獲得一個最有可能流失的客戶群體,同時編制一個有針對性的挽留方案。之后對數(shù)據(jù)進行分析并利用各種數(shù)據(jù)挖掘技術(shù)和方法在多個可供選擇的模型中找出最佳模型。初始階段,模型的擬合程度可能不理想,但是隨著模型的不斷更換和優(yōu)化,最終就有可能找出合適的模型進行數(shù)據(jù)描述并挖掘出流失數(shù)據(jù)規(guī)律。通常模擬模型都通過數(shù)據(jù)分析專業(yè)和業(yè)務(wù)專家協(xié)作完成,采用決策樹、貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)等流失分析模型,實現(xiàn)客戶行為的預(yù)測分析。
3結(jié)語
從工業(yè)營銷中的客戶細分觀點出發(fā),在數(shù)據(jù)挖掘、客戶關(guān)系管理等理論基礎(chǔ)上,采用統(tǒng)計學(xué)、運籌學(xué)和數(shù)據(jù)挖掘技術(shù),對客戶細分的數(shù)據(jù)挖掘方法進行了研究,建立了基于決策樹的客戶細分模型,是一種效率很高的管理工具。
作者:區(qū)嘉良 呂淑儀 單位:中國石化廣東石油分公司
數(shù)據(jù)挖掘論文6
摘 要:數(shù)據(jù)挖掘技術(shù)在各行業(yè)都有廣泛運用,是一種新興信息技術(shù)。而在線考試系統(tǒng)中存在著很多的數(shù)據(jù)信息,數(shù)據(jù)挖掘技在在線考試系統(tǒng)有著重要的意義,和良好的應(yīng)用前景,從而在眾多技術(shù)中脫穎而出。本文從對數(shù)據(jù)挖掘技術(shù)的初步了解,簡述數(shù)據(jù)挖掘技術(shù)在在線考試系統(tǒng)中成績分析,以及配合成績分析,完善教學(xué)。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);在線考試;成績分析 ;完善教學(xué)
隨著計算機網(wǎng)絡(luò)技術(shù)的快速發(fā)展,計算機輔助教育的不斷普及,在線考試是一種利用網(wǎng)絡(luò)技術(shù)的重要輔助教育手段,其改革有著重要的意義。數(shù)據(jù)挖掘技術(shù)作為一種新興的信息技術(shù),其包括了人工智能、數(shù)據(jù)庫、統(tǒng)計學(xué)等學(xué)科的內(nèi)容,是一門綜合性的技術(shù)。這種技術(shù)的主要特點是對數(shù)據(jù)庫中大量的數(shù)據(jù)進行抽取、轉(zhuǎn)換和分析,從中提取出能夠?qū)處熡凶饔玫年P(guān)鍵性數(shù)據(jù)。將其運用于在線考試系統(tǒng)中,能夠很好的處理在線考試中涉及到的數(shù)據(jù),讓在線考試的實用性和高效性得到進一步的增強,幫助教師更加快速、完整的統(tǒng)計考試信息,完善教學(xué)。
1.初步了解數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘技術(shù)是從大量數(shù)據(jù)中"挖掘"出對使用者有用的知識,即從大量的、隨機的、有噪聲的、模糊的、不完全的實際應(yīng)用數(shù)據(jù)中,"挖掘"出隱含在其中但人們事先卻不知道的,而又是對人們潛在有用的信息與知識的整個過程。
目前主要的商業(yè)數(shù)據(jù)挖掘系統(tǒng)有SAS公司的Enterprise Miner,SPSS公司的Clementine,Sybas公司的Warehouse Studio,MinerSGI公司的Mineset,RuleQuest Research公司的See5,IBM公司的Intelligent,還有 CoverStory, Knowledge Discovery,Quest,EXPLORA, DBMiner,Workbench等。
2.數(shù)據(jù)挖掘在在線考試中的主要任務(wù)
2.1數(shù)據(jù)分類
數(shù)據(jù)挖掘技術(shù)通過對數(shù)據(jù)庫中的數(shù)據(jù)進行分析,把數(shù)據(jù)按照相似性歸納成若干類別,然后做出分類,并能夠為每一個類別都做出一個準確的描述,挖掘出分類的規(guī)則或建立一個分類模型。
2.2數(shù)據(jù)關(guān)聯(lián)分析
數(shù)據(jù)庫中的數(shù)據(jù)關(guān)聯(lián)是一項非常重要,并可以發(fā)現(xiàn)的知識。數(shù)據(jù)關(guān)聯(lián)就是兩組或兩組以上的數(shù)據(jù)之間有著某種規(guī)律性的聯(lián)系。數(shù)據(jù)關(guān)聯(lián)分析的作用就是找出數(shù)據(jù)庫中隱藏的聯(lián)系,從中得到一些對學(xué)校教學(xué)工作管理者有用的信息。就像是在購物中,就可以通過顧客的購買物品的聯(lián)系,從中得到顧客的購買習慣。
2.3預(yù)測
預(yù)測是根據(jù)已經(jīng)得到的數(shù)據(jù),從而對未來的情況做出一個可能性的分析。數(shù)據(jù)挖掘技術(shù)能自動在大型的數(shù)據(jù)庫中做出一個較為準確的分析。就像是在市場投資中,可以通過各種商品促銷的數(shù)據(jù)來做出一個未來商品的促銷走勢。從而在投資中得到最大的回報。
3.數(shù)據(jù)挖掘的方法
數(shù)據(jù)挖掘技術(shù)融合了多個學(xué)科、多個領(lǐng)域的知識與技術(shù),因此數(shù)據(jù)挖掘的方法也呈現(xiàn)出很多種類的形式。就目前的統(tǒng)計分析類的數(shù)據(jù)挖掘技術(shù)的角度來講,光統(tǒng)計分析技術(shù)中所用到的數(shù)據(jù)挖掘模型就回歸分析、邏輯回歸分析、有線性分析、非線性分析、單變量分析、多變量分析、最近鄰算法、最近序列分析、聚類分析和時間序列分析等多種方法。數(shù)據(jù)挖掘技術(shù)利用這些方法對那些異常形式的數(shù)據(jù)進行檢查,然后通過各種數(shù)據(jù)模型和統(tǒng)計模型對這些數(shù)據(jù)來進行解釋,并從這些數(shù)據(jù)中找出隱藏在其中的商業(yè)機會和市場規(guī)律。另外還有知識發(fā)現(xiàn)類數(shù)據(jù)挖掘技術(shù),這種和統(tǒng)計分析類的數(shù)據(jù)挖掘技術(shù)完全不同,其中包括了支持向量機、人工神經(jīng)元網(wǎng)絡(luò)、遺傳算法、決策樹、粗糙集、關(guān)聯(lián)順序和規(guī)則發(fā)現(xiàn)等多種方法。
4.數(shù)據(jù)挖掘在考試成績分析中的幾點應(yīng)用
4.1運用關(guān)聯(lián)規(guī)則分析教師的年齡對學(xué)生考試成績的影響
數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)分析在教學(xué)分析中,是一種使用頻繁,行之有效的方法,它能挖掘出大量數(shù)據(jù)中項集之間之間有意義的'關(guān)聯(lián)聯(lián)系,幫助知道教師的教學(xué)過程。例如在如今的一些高職院校中,就往往會把學(xué)生的英語四六級過級率,計算機等級等,以這些為依據(jù)來評價教師的教學(xué)效果。將數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則運用于考試的成績分析當中,就能夠挖掘出一些對學(xué)生過級率產(chǎn)生影響的因素,對教師的教學(xué)過程進行重要的指導(dǎo),讓教師的教學(xué)效率更高,作用更強。
還可以通過關(guān)聯(lián)規(guī)則算法,先設(shè)定一個最小可信度和支持度,得到初步的關(guān)聯(lián)規(guī)則,根據(jù)相關(guān)規(guī)則,分析出教師的組成結(jié)構(gòu)和過級率的影響,從來進行教師隊伍的結(jié)構(gòu)調(diào)整,讓教師隊伍更加合理。
4.2采用分類算法探討對考試成績有影響的因素
數(shù)據(jù)挖掘技術(shù)中的分類算法就是對一組對象或一個事件進行歸類,然后通過這些數(shù)據(jù),可以進行分類模型的建立和未來的預(yù)測。分類算法可以進行考試中得到的數(shù)據(jù)進行分類,然后通過學(xué)生的一些基本情況進行探討一些對考試成績有影響的因素。分類算法可以用一下步驟實施:
4.2.1數(shù)據(jù)采集
這種方法首先要進行數(shù)據(jù)采集,需要這幾方面的數(shù)據(jù),學(xué)生基本信息(姓名、性別、學(xué)號、籍貫、所屬院系、專業(yè)、班級等)、學(xué)生調(diào)查信息(比如學(xué)習前的知識掌握情況、學(xué)習興趣、課堂學(xué)習效果、課后復(fù)習時間量等)、成績(學(xué)生平常學(xué)習成績,平常考試成績,各種大型考試成績等)、學(xué)生多次考試中出現(xiàn)的易錯點(本次考試中出現(xiàn)的易錯點,以往考試中出現(xiàn)的易錯點)
4.2.2數(shù)據(jù)預(yù)處理
。1)數(shù)據(jù)集成。把數(shù)據(jù)采集過程中得到的多種信息,利用數(shù)據(jù)挖掘技術(shù)中的數(shù)據(jù)庫技術(shù)生產(chǎn)相應(yīng)的學(xué)生考試成績分析基本數(shù)據(jù)庫。(2)數(shù)據(jù)清理。在學(xué)生成績分析數(shù)據(jù)庫中,肯定會出現(xiàn)一些情況缺失,對于這些空缺處,就需要使用數(shù)據(jù)清理技術(shù)來進行這些數(shù)據(jù)庫中數(shù)據(jù)的填補遺漏。例如,可以采用忽略元組的方法來刪除那些沒有參加考試的學(xué)生考試數(shù)據(jù)已經(jīng)在學(xué)生填寫的調(diào)查數(shù)據(jù)中村中的空缺項。(3)數(shù)據(jù)轉(zhuǎn)換。數(shù)據(jù)轉(zhuǎn)換主要功能是進行進行數(shù)據(jù)的離散化操作。在這個過程中可以根據(jù)實際需要進行分類,比如把考試成績從0~59的分到較差的一類,將60到80分為中等類,81到100分為優(yōu)秀等。(4)數(shù)據(jù)消減。數(shù)據(jù)消減的功能就是把所需挖掘的數(shù)據(jù)庫,在消減的過程又不能影響到最終的數(shù)據(jù)挖掘結(jié)果。比如在分析學(xué)生的基本學(xué)習情況的影響因素情況中,學(xué)生信息表中中出現(xiàn)的字段很多,可以選擇性的刪除班別、籍貫等引述,形成一份新的學(xué)生基本成績分析數(shù)據(jù)表。
4.2.3利用數(shù)據(jù)挖掘技術(shù),得出結(jié)論
通過數(shù)據(jù)挖掘技術(shù)在在線考試中的應(yīng)用,得出這些學(xué)生數(shù)據(jù)的相關(guān)分析,比如說學(xué)生考試中的易錯點在什么地方,學(xué)生考試成績的自身原因,學(xué)生考試成績的環(huán)境原因,教師隊伍的搭配情況等等,從中得出如何調(diào)整學(xué)校教學(xué)資源,教師的教學(xué)方案調(diào)整等等,從而完善學(xué)校對學(xué)生的教學(xué)。
5.結(jié)語
數(shù)據(jù)挖掘技術(shù)在社會各行各業(yè)中都有一定程度的使用,基于其在數(shù)據(jù)組織、分析能力、知識發(fā)現(xiàn)和信息深層次挖掘的能力,在使用中取得了顯著的成效,但數(shù)據(jù)挖掘技術(shù)中還存在著一些問題,例如數(shù)據(jù)的挖掘算法、預(yù)處理、可視化問題、模式識別和解釋等等。對于這些問題,學(xué)校教學(xué)管理工作者要清醒的認識,在在線考試系統(tǒng)中對數(shù)據(jù)挖掘信息做出合理的使用,讓數(shù)字挖掘技術(shù)在在線考試系統(tǒng)中能夠更加有效的發(fā)揮其長處,避免其在在線考試系統(tǒng)中的的缺陷。
參考文獻:
[1]胡玉榮.基于粗糙集理論的數(shù)據(jù)挖掘技術(shù)在高校學(xué)生成績分析中的作用[J].荊門職業(yè)技術(shù)學(xué)院學(xué)報,20xx,12(22):12.
[2][加]韓家煒,堪博(Kam ber M.) .數(shù)據(jù)挖掘:概念與技術(shù)(第2版)[M]范明,譯.北京:機械工業(yè)出版社,20xx.
[3]王潔.《在線考試系統(tǒng)的設(shè)計與開發(fā)》[J].山西師范大學(xué)學(xué)報,20xx(2).
[4] 王長娥.數(shù)據(jù)挖掘技術(shù)在教育中的應(yīng)用[J].計算機與信息技術(shù),20xx(11)
數(shù)據(jù)挖掘論文7
1、數(shù)據(jù)挖掘技術(shù)的應(yīng)用及特點
數(shù)據(jù)挖掘技術(shù)是一種新型的技術(shù),在現(xiàn)代數(shù)據(jù)存儲以及測量技術(shù)的迅猛發(fā)展過程中,人們可以進行信息的大量測量并進行存儲。但是,在大量的信息背后卻沒有一種有效的手段和技術(shù)進行直觀的表達和分析。而數(shù)據(jù)挖掘技術(shù)的出現(xiàn),是對目前大數(shù)據(jù)時代的一種應(yīng)急手段,使得有關(guān)計算機數(shù)據(jù)處理技術(shù)得到加快發(fā)展。數(shù)據(jù)挖掘技術(shù)最早是從機器學(xué)習的概念中而產(chǎn)生的,在對機器的學(xué)習過程中,一般不采用歸納或者較少使用這種方法,這是一種非常機械的操作辦法。而沒有指導(dǎo)性學(xué)習的辦法一般不從這些環(huán)境得出反饋,而是通過沒有干預(yù)的情況下進行歸納和學(xué)習,并建立一種理論模型。數(shù)據(jù)挖掘技術(shù)是屬于例子歸納學(xué)習的一種方式,這種從例子中進行歸納學(xué)習的方式是介于上述無指導(dǎo)性學(xué)習以及較少使用歸納學(xué)習這兩種方式之間的一種方式。因此,可以說,數(shù)據(jù)挖掘技術(shù)的特征在出自于機器學(xué)習的背景下,與其相比機器主要關(guān)心的是如何才能有效提高機器的學(xué)習能力,但數(shù)據(jù)挖掘技術(shù)主要關(guān)心如何才能找到有用、有價值的信息。其第二個特征是,與機器學(xué)習特點相比較而言,機器關(guān)心的是小數(shù)據(jù),而數(shù)據(jù)挖掘技術(shù)所面臨的對象則是現(xiàn)實中海量規(guī)模的數(shù)據(jù)庫,其作用主要是用來處理一些異常現(xiàn)象,特別是處理殘缺的、有噪音以及維數(shù)很高的數(shù)據(jù)項,甚至是一些不同類型數(shù)據(jù)。以往的數(shù)據(jù)處理方法和現(xiàn)代的數(shù)據(jù)挖掘技術(shù)相比較而言,其不同點是以往的傳統(tǒng)數(shù)據(jù)處理方法前提是把理論作為一種指導(dǎo)數(shù)據(jù)來進行處理,在現(xiàn)代數(shù)據(jù)挖掘技術(shù)的出發(fā)角度不同,主要運用啟發(fā)式的歸納學(xué)習進行理論以及假設(shè)來處理的。
2、數(shù)據(jù)挖掘技術(shù)主要步驟
數(shù)據(jù)挖掘技術(shù)首先要建立數(shù)據(jù)倉庫,要根據(jù)實際情況而定,在易出現(xiàn)問題的有關(guān)領(lǐng)域建立有效的數(shù)據(jù)庫。主要是用來把數(shù)據(jù)庫中的所有的存儲數(shù)據(jù)進行分析,而目前的一些數(shù)據(jù)庫雖然可以進行大量的存儲數(shù)據(jù),同時也進行了一系列的技術(shù)發(fā)展。比如,系統(tǒng)中的在線分析處理,主要是為用戶查詢,但是卻沒有查詢結(jié)果的分析能力,而查詢的結(jié)果仍舊由人工進行操作,依賴于對手工方式進行數(shù)據(jù)測試并建模。其次,在數(shù)據(jù)庫中存儲的數(shù)據(jù)選一數(shù)據(jù)集,作為對數(shù)據(jù)挖掘算法原始輸入。此數(shù)據(jù)集所涉及到數(shù)據(jù)的時變性以及統(tǒng)一性等情況。然后,再進行數(shù)據(jù)的預(yù)處理,在處理中主要對一些缺損數(shù)據(jù)進行補齊,并消除噪聲,此外還應(yīng)對數(shù)據(jù)進行標準化的處理。隨后,再對數(shù)據(jù)進行降維和變換。如果數(shù)據(jù)的維數(shù)比較高,還應(yīng)找出維分量高的數(shù)據(jù),對高維數(shù)數(shù)據(jù)空間能夠容易轉(zhuǎn)化為檢點的低維數(shù)數(shù)據(jù)空間進行處理。下一步驟就是確定任務(wù),要根據(jù)現(xiàn)實的需要,對數(shù)據(jù)挖掘目標進行確定,并建立預(yù)測性的模型、數(shù)據(jù)的摘要等。隨后再決定數(shù)據(jù)挖掘的算法,這一步驟中,主要是對當前的數(shù)據(jù)類型選擇有效的處理方法,此過程非常重要,在所有數(shù)據(jù)挖掘技術(shù)中起到較大作用。隨后再對數(shù)據(jù)挖掘進行具體的處理和結(jié)果檢驗,在處理過程中,要按照不同的目的,選擇不同的算法,是運用決策樹還是分類等的算法,是運用聚類算法還是使用回歸算法,都要認真處理,得出科學(xué)的結(jié)論。在數(shù)據(jù)挖掘結(jié)果檢驗時,要注意幾個問題,要充分利用結(jié)論對照其他的信息進行校核,可對圖表等一些直觀的信息和手段進行輔助分析,使結(jié)論能夠更加科學(xué)合理。需要注意的是要根據(jù)用戶來決定結(jié)論有用的程度。最后一項步驟是把所得出的結(jié)論進行應(yīng)用到實際,要對數(shù)據(jù)挖掘的結(jié)果進行仔細的校驗,重點是解決好以前的觀點和看法有無差錯,使目前的結(jié)論和原先看法的矛盾有效解除。
3、數(shù)據(jù)挖掘技術(shù)的方法以及在電力營銷系統(tǒng)中的應(yīng)用和發(fā)展
數(shù)控挖掘技術(shù)得到了非常廣泛的應(yīng)用,按照技術(shù)本身的發(fā)展出現(xiàn)了較多方法。例如,建立預(yù)測性建模方法,也就是對歷史數(shù)據(jù)進行分析并歸納總結(jié),從而建立成預(yù)測性模型。根據(jù)此模型以及當前的其他數(shù)據(jù)進行推斷相關(guān)聯(lián)的數(shù)據(jù)。如果推斷的對象屬于連續(xù)型的變量,那么此類的`推斷問題可屬回歸問題。根據(jù)歷史數(shù)據(jù)來進行分析和檢測,再做出科學(xué)的架設(shè)和推定。在常用的回歸算法以及非線性變換進行有效的結(jié)合,能夠使許多問題得到解決。電力營銷系統(tǒng)中的數(shù)據(jù)挖掘技術(shù)應(yīng)用中關(guān)聯(lián)規(guī)則是最為關(guān)鍵的技術(shù)應(yīng)用之一。這種應(yīng)用可以有效地幫助決策人員進行當前有關(guān)數(shù)據(jù)以及歷史數(shù)據(jù)的規(guī)律分析,最后預(yù)測出未來情況。把關(guān)聯(lián)規(guī)則成功引入電力營銷分析,通過FP-Growth算法對電力營銷的有關(guān)數(shù)據(jù)進行關(guān)聯(lián)規(guī)則分析,從中得出各種電量銷售的影響因素以及外部因素、手電水平等的關(guān)聯(lián)信息,以便更好地為電力的市場營銷策略提供參謀和決策。對電力營銷系統(tǒng)的應(yīng)用中,時間序列挖掘以及序列挖掘非常經(jīng)典、系統(tǒng),是應(yīng)用最為廣泛的一種預(yù)測方法。這種方法的應(yīng)用中,對神經(jīng)網(wǎng)絡(luò)的研究非常之多。因此,在現(xiàn)實中應(yīng)用主要把時間序列挖掘以及神經(jīng)網(wǎng)絡(luò)兩者進行有效地結(jié)合,然后再分析有關(guān)電力營銷數(shù)據(jù)。此外,有關(guān)專家還提出應(yīng)用一種時間窗的序列挖掘算法,這種方式可以進行有效地報警處理,使電力系統(tǒng)中的故障能夠準確的定位并診斷事故。此算法對電力系統(tǒng)的分析和挖掘能力的提高非常有效,還可判定電力系統(tǒng)的運行是否穩(wěn)定,對錯誤模型的分析精度達到一定的精確度。
4、結(jié)語
目前,對數(shù)據(jù)挖掘技術(shù)在整個電力營銷系統(tǒng)中的應(yīng)用還處于較低水平上,其挖掘算法的單一并不能有效地滿足實際決策需要。但是,由于數(shù)據(jù)挖掘技術(shù)對一些潛在的問題預(yù)測能力較強,特別是對電力營銷系統(tǒng)中較大規(guī)模的非線性問題,具有較強的處理能力,在未來的發(fā)展中會成為營銷領(lǐng)域中重要的應(yīng)用工具。
數(shù)據(jù)挖掘論文8
摘要:本文簡述如何將數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書館各部門管理中,幫助圖書館管理者依據(jù)數(shù)據(jù)挖掘技術(shù)更好地為讀者提供科學(xué)化和人性化的服務(wù),促進圖書館事業(yè)的創(chuàng)新與發(fā)展。
關(guān)鍵詞:高校圖書館;數(shù)據(jù)挖掘;創(chuàng)新;發(fā)展。
隨著網(wǎng)絡(luò)技術(shù)、計算機技術(shù)的快速發(fā)展,高校圖書館事業(yè)也順應(yīng)時變,不斷向高科技、高水平領(lǐng)域進展,尤其是當今處于數(shù)字信息發(fā)展的時代。如果利用圖書館現(xiàn)有以及收集的數(shù)據(jù)資源,通過數(shù)據(jù)挖掘技術(shù)來分析、篩選對圖書館有用的數(shù)據(jù)信息,依據(jù)提煉的數(shù)據(jù)資源來指導(dǎo)、推進圖書館事業(yè)的創(chuàng)新與發(fā)展,是當今信息時代圖書館亟待研究、探討的一個問題。本文將簡述如何將數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書館各部門管理之中,幫助圖書館管理者依據(jù)數(shù)據(jù)挖掘技術(shù)更好地為讀者提供科學(xué)化和人性化的服務(wù),促進圖書館的事業(yè)創(chuàng)新與發(fā)展。
一、數(shù)據(jù)挖掘技術(shù)綜述。
數(shù)據(jù)挖掘定義。數(shù)據(jù)挖掘(Data Mining,DM)是一種新的信息處理技術(shù),其主要特點是對單位、企業(yè)數(shù)據(jù)庫中的大量業(yè)務(wù)數(shù)據(jù)進行抽取、轉(zhuǎn)換分析和其他模型化處理,以從中提取輔助管理決策的關(guān)鍵性數(shù)據(jù)。數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的和隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的但又是潛在有用的信息和知識的過程。換句話說,數(shù)據(jù)挖掘技術(shù)就是從收集的大量、繁雜的數(shù)據(jù)中挖掘出其隱含的、未知的、對決策有潛在價值的關(guān)系、模式和趨勢,并用這些知識和規(guī)則建立用于決策支持的模型,提供預(yù)測性決策支持的方法、工具和過程。
數(shù)據(jù)挖掘的意義。在當今的競爭時代社會中,隨著計算機的飛速發(fā)展,計算機強大的數(shù)據(jù)處理能力、內(nèi)存儲存容量和網(wǎng)絡(luò)寬帶等價格的持續(xù)快速下降,因此大型的`數(shù)據(jù)分析、提取技術(shù)不再是一個障礙。面對圖書館每天接收的龐大數(shù)據(jù)源,管理者必須學(xué)會從所擁有的大量數(shù)據(jù)信息源中提取并利用隱含在這些數(shù)據(jù)中的有用價值以及有用新信息,從而獲取對圖書館事業(yè)研究領(lǐng)域的本質(zhì)認知和未來認知,幫助圖書館管理者從傳統(tǒng)的經(jīng)驗管理、主觀管理提升為理性管理和科學(xué)管理。
數(shù)據(jù)挖掘的應(yīng)用分類。目前較常用的一般有分類與回歸、關(guān)聯(lián)規(guī)則、聚類分析、時序模式等。
二、數(shù)據(jù)挖掘技術(shù)對圖書館事業(yè)創(chuàng)新與發(fā)展的影響。
面對大量數(shù)據(jù),如何去存儲和收集數(shù)據(jù),如何利用數(shù)據(jù)挖掘技術(shù)將圖書館海量信息數(shù)據(jù)中提取供管理者決策的有價值的數(shù)據(jù),提取并利用隱藏在這些數(shù)據(jù)中的有用知識的能力變得越來越重要。運用數(shù)據(jù)挖掘技術(shù)從數(shù)據(jù)中獲得有用的知識,這在圖書館管理方面顯得尤為重要,本文將簡述如何將數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書館各部門工作,為今后各部門的創(chuàng)新與發(fā)展提供策略分析。
流通部門。流通部門作為圖書館的一線服務(wù)崗位,對圖書館功能的發(fā)揮起著舉足輕重的作用。作為窗口形象崗位,直接體現(xiàn)了圖書館的整體工作狀態(tài)。
要實現(xiàn)從以往的經(jīng)驗管理、主觀管理提升為科學(xué)管理和理性管理,數(shù)據(jù)挖掘技術(shù)將利用現(xiàn)代技術(shù)展現(xiàn)其獨天得厚的優(yōu)勢。圖書館每天都會產(chǎn)生大量的圖書流通數(shù)據(jù),這些數(shù)據(jù)包含進、出館讀者人數(shù),借、還書數(shù)量,檢索查詢次數(shù)以及網(wǎng)上咨詢等大量繁雜的數(shù)據(jù)。在流通部門最為常用的數(shù)據(jù)就是借書、還書量,通過借書、還書數(shù)據(jù)的統(tǒng)計,可獲取讀者信息行為、借閱書興趣導(dǎo)向,充分利用數(shù)據(jù)挖掘技術(shù)如關(guān)聯(lián)規(guī)則、分類、聚類、時間序列分析等,對圖書館蘊含的大量豐富的用戶行為進行建模,從而挖掘出有用的或有興趣的信息和知識。如可利用這些有價值的信息,借鑒“啤酒與尿布”的經(jīng)典商業(yè)案例,嘗試在流通部開辟一塊試驗田地――搭檔書架,即通過借、還書數(shù)據(jù)挖掘,將讀者感興趣、組合搭檔頻率高的書籍挑選出來,開辟一塊搭檔書架,方便讀者在借用專業(yè)書籍的同時順便也借閱自己感興趣的圖書,既學(xué)習了自己的專業(yè)知識,同時也順便閱讀了自己感興趣的書籍,充分實現(xiàn)了圖書館“第二課堂”的育人價值。
采編部門。傳統(tǒng)的采編部門在采集書籍時大多數(shù)情況是依據(jù)采集經(jīng)驗或是依據(jù)各院系、讀者反饋的需求書籍進行征訂。大部分購買的圖書還是比較適合讀者所用的,但也會存在一些盲目性,有時會造成采集的偏差,這是采編部門一直比較困惑的問題。如何既將購書經(jīng)費合理利用好,同時又能滿足讀者借閱所需,是采編部門長期探索、研究的問題。如果將數(shù)據(jù)挖掘技術(shù)運用到采編部門,通過一線的文獻借閱數(shù)據(jù),分析、挖掘、提煉讀者借、還書的信息量,且一直追蹤這些信息數(shù)源的變化,即可獲得可被部門利用的有價值數(shù)據(jù),并匯總出讀者借、還書的規(guī)律。依據(jù)這些一線信息數(shù)源的價值,加之網(wǎng)上薦購及讀者書面薦購等信息,匯總出哪些是讀者專業(yè)常用書籍,哪些是讀者感興趣的書籍,哪些又是常年被冷落的書籍,從中提煉出書籍采集的方向;合理化的采集方案繼續(xù)延用,不合理的采集要進行科學(xué)化的數(shù)據(jù)分析,及時理清思路,盡可能做到書籍采集的合理化、科學(xué)化。
技術(shù)部門。在信息飛速發(fā)展的時代,作為圖書館負責信息網(wǎng)絡(luò)技術(shù)的部門,其肩上的重量顯得格外沉重。技術(shù)部門不但肩負著網(wǎng)絡(luò)技術(shù)的責任,當今也要肩負起圖書館所有數(shù)據(jù)的收集、存儲、挖掘及分析技術(shù)。數(shù)據(jù)挖掘及分析技術(shù)在技術(shù)部十分重要,技術(shù)部應(yīng)將圖書館各部門所產(chǎn)生的相關(guān)數(shù)據(jù)進行長期性、系統(tǒng)性的收集和科學(xué)分析,并將研究數(shù)據(jù)的挖掘及分析作為當前和今后技術(shù)部研究及發(fā)展的方向,承擔起“數(shù)據(jù)監(jiān)護員”的角色,通過實踐為圖書館提供數(shù)據(jù)監(jiān)護操作技能及策略。注意將可獲得的數(shù)據(jù)及時進行收集,并通過收集數(shù)據(jù)使用案例,分析并總結(jié)用戶需求及使用規(guī)律,為數(shù)據(jù)監(jiān)護提供基礎(chǔ)資料。
學(xué)科部門。學(xué)科部門作為一個新興的部門,目前已在全國各高校圖書館廣泛推廣運用。學(xué)科館員的主要任務(wù)是派專人與對口院系或?qū)W科專業(yè)搭建合作、交流平臺,并利用圖書館信息檢索的技術(shù)優(yōu)勢,為研究者開展長期追蹤、收集、傳遞文獻信息的科技服務(wù)。當前大部分學(xué)科館員關(guān)注的是如何為院系教學(xué)提供良好的信息傳遞幫助,而忽略了在當前信息飛速發(fā)展的時代,科研與教學(xué)走向數(shù)字化的趨勢。學(xué)者所做的所有工作,包括教案、論文、實驗、畢業(yè)設(shè)計等等工作,基本上都是以電子信息的方式進行編輯、存儲的。雖然極大地方便了學(xué)者們的工作,但同時也面臨這些電子數(shù)據(jù)的丟失風險,一旦電子數(shù)據(jù)丟失,其損失的學(xué)術(shù)價值是不可估量的。為盡量避免這些事件的發(fā)生,學(xué)科部門可依托技術(shù)部門的支撐,利用數(shù)據(jù)挖掘技術(shù),開展學(xué)者數(shù)據(jù)監(jiān)護服務(wù),保存這些非紙質(zhì)信息。這樣學(xué)科部門不僅為學(xué)者提供了科研信息的前沿追蹤,同時也提供了科學(xué)數(shù)據(jù)保存平臺;既為學(xué)者科研開辟道路,也為學(xué)者預(yù)防丟失科研數(shù)據(jù)提供保障,可謂雙保險。數(shù)據(jù)挖掘技術(shù)還可以幫助學(xué)科部通過數(shù)據(jù)挖掘、分析出讀者關(guān)注以及咨詢較多的問題,從中歸納出重點并分門別類,作為圖書館工作的重要依據(jù)。
三、結(jié)語。
數(shù)據(jù)挖掘技術(shù)在當今大數(shù)據(jù)時代,已成為一個相對成熟的學(xué)科,融入到社會的各行各業(yè)。利用數(shù)據(jù)挖掘技術(shù)對圖書館數(shù)據(jù)庫進行數(shù)據(jù)挖掘已經(jīng)成為圖書館需要開展的一項重要工作。圖書館事業(yè)已全部進入電子信息化,由此產(chǎn)生的大量業(yè)務(wù)數(shù)據(jù)和信息資源是圖書館行業(yè)的一筆寶貴財富,它較真實地反映了讀者對圖書館事業(yè)運作以及提供的服務(wù)是否到位。因此,通過數(shù)據(jù)挖掘分析,能夠幫助圖書館管理者分析并發(fā)現(xiàn)現(xiàn)有管理的不足之處,通過已知的現(xiàn)象預(yù)測未來的發(fā)展趨勢。數(shù)據(jù)挖掘技術(shù)已成為今后圖書館事業(yè)保持競爭力的必備法寶。
參考文獻:
【1】顧倩.數(shù)據(jù)挖掘應(yīng)用于高校圖書館個性化服務(wù)的探討[J].圖書館雜志,20xx,8:63-65.。
【2】王偉.基于數(shù)據(jù)挖掘的圖書館用戶行為分析與偏好研究情報科學(xué),20xx,30(3):391-394.。
【3】楊海燕.大數(shù)據(jù)時代的圖書館服務(wù)淺析[J].圖書與情報。
【4】程蓮娟.美國高校圖書館數(shù)據(jù)監(jiān)護的實踐及其啟示[J].圖書館雜志,20xx,1(31):76-78.。
數(shù)據(jù)挖掘論文9
摘要:中醫(yī)臨床理論多是由著名醫(yī)家的經(jīng)驗升華形成的,反映了臨床上不同學(xué)術(shù)派系以及不同學(xué)科的優(yōu)勢特征,但這其中不免摻雜了個人主觀經(jīng)驗,因此本文就中醫(yī)臨床理論研究中醫(yī)病案為基礎(chǔ),對應(yīng)用病案數(shù)據(jù)挖掘結(jié)果來總結(jié)和重建中醫(yī)臨床理論的方式進行了探討,認為該方法可為完善中醫(yī)臨床理論提供客觀的數(shù)據(jù)支持,使中醫(yī)臨床理論的來源更具有科學(xué)性。
關(guān)鍵詞:病案;數(shù)據(jù)挖掘;中醫(yī)臨床理論;轉(zhuǎn)化醫(yī)學(xué);臨床
科研一體化中醫(yī)臨床理論決定著中醫(yī)臨床學(xué)科的發(fā)展水平,是中醫(yī)臨床發(fā)展的動力。從古至今,中醫(yī)名醫(yī)名家輩出,他們的臨床經(jīng)驗和學(xué)術(shù)思想不斷提煉升華,逐步形成了傳統(tǒng)的中醫(yī)臨床理論。新中國成立以來,中醫(yī)不斷汲取最新的科技成果,進行了大量臨床實踐,而中醫(yī)臨床理論發(fā)展緩慢,己經(jīng)成為制約當代中醫(yī)學(xué)術(shù)發(fā)展的瓶頸,對如何開拓中醫(yī)臨床理論的研究,可謂見仁見智,但各種新的臨床理論常常裹挾著“各家學(xué)說”。在當今大數(shù)據(jù)和信息技術(shù)發(fā)達的背景下,運用數(shù)據(jù)挖掘技術(shù)對中醫(yī)病案進行大數(shù)據(jù)分析,客觀揭示當前中醫(yī)臨床理論的本來面目,盡可能減少個人見解的偏倚,對于推動中醫(yī)臨床理論發(fā)展具有重要的現(xiàn)實意義,本文就基于病案數(shù)據(jù)挖掘的中醫(yī)臨床理論重建進行探討如下。
1傳統(tǒng)中醫(yī)臨床理論的構(gòu)建框架
1.1中醫(yī)古典文獻是傳統(tǒng)中醫(yī)臨床理論的基礎(chǔ)
眾所周知,中醫(yī)之所以能夠屹立千年不倒,很大一部分原因是因為其有獨特的理論體系,而在這其中,中醫(yī)古典文獻做出的貢獻應(yīng)該是第一位的。因為這些古典文獻的記載和流傳,為后世的醫(yī)家提供了參考和借鑒,使得我們從前人的思維上不斷創(chuàng)新,與臨床進行有機結(jié)合,不斷研究出新的適合于當前時代的臨床理論。例如,中醫(yī)學(xué)無論在理論研究還是在臨床治療方面的豐富,許多根本性的理論都是源自于《內(nèi)經(jīng)》。該書創(chuàng)立了藏象、經(jīng)絡(luò)、診法等各方面的理論[1],勾畫了中醫(yī)理論的雛形,構(gòu)建了中醫(yī)理論體系的基本框架。到后期東漢時期張仲景的《傷寒論》則是創(chuàng)造了以六經(jīng)辨證和臟腑辨證為主的局面,其所倡導(dǎo)的“觀其脈證,知犯何逆,隨證治之”使得辨證論治登上新的高度。到了金元時期,就是百家爭鳴的時代,這期間以金元四大家為主的學(xué)派開始萌生,留下了許多可供后世醫(yī)家參考的古典文獻并創(chuàng)建了不同的臨床理論,而明清時期以葉天士和吳鞠通為首確立的衛(wèi)氣營血和三焦辨證,使溫病學(xué)的辨證理論逐步趨于完善,至今仍是指導(dǎo)臨床治療溫熱病的理論依據(jù)。總之,傳統(tǒng)中醫(yī)臨床理論的構(gòu)建和完善,離不開前人的摸索與貢獻,也得益于著名醫(yī)學(xué)家創(chuàng)建的傳統(tǒng)中醫(yī)理論,使得我們現(xiàn)在的中醫(yī)體系不斷的飽滿和充實。
1.2當代著名中醫(yī)的臨床經(jīng)驗不斷提升為中醫(yī)臨床理論
傳統(tǒng)中醫(yī)的臨床理論,在很大程度上展示著著名醫(yī)家的臨床經(jīng)驗。在中醫(yī)理論與實踐發(fā)展的相互促進過程中,當代醫(yī)家通過讀書、臨證、心悟?qū)嵺`經(jīng)驗不斷總結(jié)并升華為理論,又在實踐中不斷完善既有的理論,成為中醫(yī)理論發(fā)展的重要途徑和模式,而當代中醫(yī)理論的發(fā)展則需要將傳統(tǒng)理論與現(xiàn)代實踐相互融合起來。例如上世紀60年代時,面對中醫(yī)基礎(chǔ)理論中新的思想相對匱乏的這一局面,鄧鐵濤結(jié)合其治療的臨床經(jīng)驗,首次提出了“五臟相關(guān)學(xué)說”。盡管當時的理論準備并不完善,但是這一理論的提出,在很大程度上完善并且取代了“五行學(xué)說”中某些模糊性和不確定性,并且隨著時代的發(fā)展,逐漸驗證了鄧老的這一經(jīng)驗的正確性,也成為指導(dǎo)中醫(yī)臨床理論的一大重要體系[2]。又如,腦出血這一現(xiàn)代疾病在古代名為中風,多數(shù)是“從風而治”,認為肝臟與中風的關(guān)系最為密切。隨著時代的推進,自20世紀80年代以來,許多學(xué)者根據(jù)微觀辨證和中醫(yī)理論“離經(jīng)之血便是瘀”,提出急性出血中風屬中醫(yī)血證,瘀血阻滯是急性期腦出血的最基本病機,是治療的關(guān)鍵所在[3]。故現(xiàn)代中醫(yī)臨床治療上多以活血化瘀法治療腦出血、腦梗塞這一系列疾病。若是仔細研讀傳統(tǒng)中醫(yī)臨床理論后,我們不難得出其構(gòu)成和完善離不開當代著名醫(yī)家的臨床經(jīng)驗,它是在歷經(jīng)歲月的洗禮下不斷塑造成型的。
1.3傳統(tǒng)中醫(yī)臨床理論不斷將現(xiàn)代醫(yī)學(xué)相關(guān)內(nèi)容中醫(yī)化
傳統(tǒng)中醫(yī)臨床理論不斷吸收現(xiàn)代醫(yī)學(xué)的理論,將其相關(guān)內(nèi)容不斷中醫(yī)化,將病人的各種證型通過五臟辨證、陰陽五行辨證以及八綱辨證劃分得越來越細化,以提供病人在中醫(yī)臨床上治療的理論依據(jù)。中醫(yī)吸取了現(xiàn)代醫(yī)學(xué)理論后正在不斷壯大其內(nèi)容,現(xiàn)代醫(yī)學(xué)相關(guān)內(nèi)容中醫(yī)化在許多難治疾病的辨證治療中都起到了良好的指導(dǎo)作用[4]。如艾滋病是古代傳統(tǒng)中醫(yī)辨證論治的'空白,通過對艾滋病中醫(yī)病因病機、證候規(guī)律、治法方藥的系統(tǒng)研究,提出了“艾毒傷元”“脾為樞機”“氣虛為本”的病因病機學(xué)說,確立了艾滋病“培元解毒”“益氣健脾”的治療原則,為中醫(yī)藥防治艾滋病奠定了理論基礎(chǔ),為進一步提高艾滋病的中醫(yī)藥臨床診療效果提供理論依據(jù)[5]。
2當前中醫(yī)臨床理論發(fā)展存在的不足
2.1中醫(yī)主流理論不突出且與時俱進力度不夠
不可否認的是,當代的中醫(yī)臨床理論發(fā)展也是存在諸多不足的,中醫(yī)理論的完善和發(fā)展是中華五千年來集體智慧的結(jié)晶,個別醫(yī)家提出的臨床理論可能各有千秋,其所立的角度和思維也不盡相同。例如,同是治療輸卵管阻塞這一疾病時,朱南孫教授認為多是由于濕蘊沖任所致,其用自擬的清熱利濕方來進行治療;而李廣文教授則認為這一疾病多是由于瘀血阻絡(luò)為主,治療上以活血祛瘀為法,擬通任種子湯進行治療[6]。又如對于“和解法”這一治療方法的理解,當代名醫(yī)蒲輔周老先生認為“寒熱并用,補瀉合劑,表里雙解,苦辛分消,調(diào)和氣血,皆謂和解”。而方和謙教授則認為“在治法上扶正祛邪,表里兼顧,此法就為和解法”。不同的醫(yī)家在面對不同的疾病,甚至是不同的理法方藥時,所持的看法常常是“各家學(xué)說”,這就導(dǎo)致了當前中醫(yī)臨床理論發(fā)展比較混亂,不能全面地體現(xiàn)中國五千年來發(fā)展過程中的中醫(yī)主流理論。目前中醫(yī)基礎(chǔ)理論還存在一個缺陷就是它的與時俱進力度還不夠,很多古代經(jīng)典方藥的主治病癥,在當今時代已經(jīng)不再多見了。比如蛔蟲導(dǎo)致的蛔厥這一致病因素在現(xiàn)代已經(jīng)不再常見,對應(yīng)的烏梅丸的主要適應(yīng)病癥也不再是蛔厥;在針對沒有明顯臨床表現(xiàn)的疾病如乙肝時,按傳統(tǒng)中醫(yī)往往體現(xiàn)出“無證可治”的狀態(tài);傳統(tǒng)的診斷與現(xiàn)代檢查相結(jié)合的力度也不夠,中醫(yī)臨床基礎(chǔ)理論在某些程度上忽略了其與生化、B超、X光、CT等現(xiàn)代檢查結(jié)果的結(jié)合,并沒有用中醫(yī)理論對其做一合理的陳述;且現(xiàn)在臨床上很多中藥的藥理作用、性味歸經(jīng)的研究作用還不夠深入、細致,其作用不能在微觀上得以解釋。這些都導(dǎo)致了臨床上很多情況沒有從中醫(yī)理論來認識中醫(yī),不是“以中解中”,而是“以西解中”,形成了臨床拋棄中醫(yī)理論的狀態(tài)[7]。由于中醫(yī)學(xué)是一門實踐性很強的學(xué)科,它是在哲學(xué)辨證的思想指導(dǎo)下,與臨床經(jīng)驗不斷結(jié)合,這與西醫(yī)知識體系相比較,難免存在一定的滯后性,這都會使得中醫(yī)臨床理論發(fā)展相對的落后。
2.2部分中醫(yī)理論帶有權(quán)威專家的“個人學(xué)說”偏見
傳統(tǒng)中醫(yī)強調(diào)個人經(jīng)驗和學(xué)說,以中醫(yī)內(nèi)科學(xué)為例,第八版中的腦系疾病在第九版中已經(jīng)刪除,其涉及到的各種腦系疾病大多數(shù)歸屬于心系疾病與肝系疾病。根據(jù)其版本的不同,我們可以明顯看出其凸顯的中心內(nèi)容及其思想不同,其多是體現(xiàn)編著者的理論思想,在一定程度上并沒有客觀地揭示疾病的本質(zhì),治療理論也不夠完善,一部分內(nèi)容與最新研究得出的論文理論不符,這使得當代中醫(yī)臨床理論在某些程度上,帶有權(quán)威專家的“個人學(xué)說”色彩。由于現(xiàn)代西方先進的科技文化流入,使得中醫(yī)在一定程度上備受質(zhì)疑,而正是因為人們對于中醫(yī)理論的一些偏見,才使得中醫(yī)長期讓人詬病。
3新的時代背景下中醫(yī)臨床理論發(fā)展方向
3.1臨床理論應(yīng)具有真實性與系統(tǒng)性
中醫(yī)臨床理論的發(fā)展方形應(yīng)當是建立在客觀并且真實的臨床實踐基礎(chǔ)上,從一次次臨床實踐中得出。由于歷史時代的原因以及假設(shè)推理、模式建設(shè)的廣泛使用,當代中醫(yī)臨床理論中理論與假說并存的現(xiàn)象較為普遍,如中醫(yī)的五運六氣學(xué)說對現(xiàn)代疫病預(yù)測和人體各經(jīng)絡(luò)臟腑在時間上對于人體治病效果的不同等,就需要我們在扎實的文獻與臨床實踐基礎(chǔ)上,對醫(yī)案進行認真總結(jié),利用科學(xué)的方法深入挖掘,開展中醫(yī)理論的去偽存真研究,以促進中醫(yī)理論的科學(xué)與健康發(fā)展。另外,傳統(tǒng)的中醫(yī)臨床治療上所用的理法方藥,多是根據(jù)個人經(jīng)驗所進行的。隨著科技的不斷發(fā)展與時代的不斷進步,當代的中醫(yī)臨床理論應(yīng)該在成功的中醫(yī)醫(yī)案上進行系統(tǒng)的總結(jié),不斷挖掘和研究其微觀的結(jié)構(gòu),并隨著年月的更迭不斷更新,不斷完善,使其具有科學(xué)性和理論依據(jù)。同時,對近年來興起的傳染性非典型肺炎、艾滋病、禽流感等古人所沒有經(jīng)歷過的疾病的診治,中醫(yī)就其病因病機的認識以及探究相應(yīng)的診療方法,無疑也是一種理論上的創(chuàng)新[8]。通過對其進行深一層次的研究和發(fā)現(xiàn),歸納出合適的治則治法,找到針對這一疾病的理法方藥,使其更具有系統(tǒng)性,使得臨床上中醫(yī)治病可以循序漸進,注重整體,也是當代臨床理論的一大發(fā)展方向。
3.2臨床理論具有信息化的特點并可持續(xù)拓展
隨著時代的進步,當代的中醫(yī)臨床理論可以通過網(wǎng)絡(luò)等方式進行共享,在大數(shù)據(jù)的這一時代背景下,隨著病案的不斷報道與積累,可以將各類成功的中醫(yī)醫(yī)案進行統(tǒng)計和挖掘,其結(jié)果也會不斷進行更新和發(fā)展。不同的醫(yī)家對于某一疾病的認識角度可能不同,其表現(xiàn)在病位、病性、病勢和證候的判斷標準也不一樣,因此方藥規(guī)律也不一樣。而通過統(tǒng)計某一中醫(yī)或西醫(yī)疾病的較大樣本病例,并對其進行數(shù)據(jù)挖掘,可以得出整個中醫(yī)群體對于這一疾病診治的證候分布、治則治法、處方用藥等的規(guī)律,甚至可以根據(jù)統(tǒng)計的結(jié)果探索出新的方藥,分析他們的共同點和所在差異。將中醫(yī)臨床理論具有信息化的這一特點不斷地拓展下去,通過計算機等客觀科學(xué)的手段進行分析,與主觀的名老中醫(yī)傳承模式相比,更具客觀性,更容易被臨床醫(yī)生接受,對各種疾病的中醫(yī)臨床用藥也更具有指導(dǎo)價值。
4基于病案數(shù)據(jù)挖掘的中醫(yī)臨床理論重建
4.1病案研究是中醫(yī)理論發(fā)展的重要基礎(chǔ)
在當今大數(shù)據(jù)的時代背景下,中醫(yī)固有的傳統(tǒng)整體論科學(xué)特征有了越來越多的可供改變的空間。這種變化既為其按照自身特有的規(guī)律發(fā)展特點帶來了機遇,也給未來中醫(yī)理論的發(fā)展提出了挑戰(zhàn)。同時,學(xué)習醫(yī)案研究也是中醫(yī)學(xué)相關(guān)大學(xué)生們應(yīng)該學(xué)習的一項內(nèi)容。閱讀醫(yī)案是必要的訓(xùn)練,也是中醫(yī)入門的方法之一。醫(yī)案的故事性引人入勝,在自然而然中接受中醫(yī)思維方法和傳統(tǒng)文化知識,同時醫(yī)案中所呈現(xiàn)的名醫(yī)風范,醫(yī)德對學(xué)生起到潛移默化的影響,并培養(yǎng)對專業(yè)的熱愛[9]。病案客觀、真實地直接記錄疾病診斷和治療過程,醫(yī)案研究作為中醫(yī)理論發(fā)展過程中至關(guān)重要的一環(huán),是中醫(yī)理論發(fā)展的重要基礎(chǔ),以研究病案為基礎(chǔ),對于中醫(yī)理論的形成和臨床上中醫(yī)積累經(jīng)驗,都起到了一定的輔助提升作用。
4.2數(shù)據(jù)挖掘方法是中醫(yī)理論發(fā)展的現(xiàn)代技術(shù)手段
利用多種數(shù)據(jù)挖掘技術(shù)對中醫(yī)病案中的有關(guān)信息行進行歸納、整理,是近年來傳承中醫(yī)臨床經(jīng)驗的重要方法之一[10]。通過對同一種疾病的病案進行數(shù)據(jù)挖掘以分析醫(yī)者的思路和探索其用藥的方法,對中醫(yī)臨床病案進行規(guī)范化的整理,能夠深入總結(jié)其臨床經(jīng)驗,挖掘隱藏在大量病案背后的診治規(guī)律,甚至探索出新的方藥配伍,為中醫(yī)理論的發(fā)展提供一定的科學(xué)依據(jù)的同時,使得中醫(yī)理論的發(fā)展越來越現(xiàn)代化,不僅僅只是停留在以前的靠讀書和個人經(jīng)驗的結(jié)合,也為廣大的中醫(yī)在日后的臨床治療上提供了新的思路和方向。
4.3臨床實踐推動理論發(fā)展,賦予轉(zhuǎn)化醫(yī)學(xué)新的內(nèi)涵
目前,我們通過并按數(shù)據(jù)挖掘來總結(jié)一些中醫(yī)對于治療同一種疾病所采取的診斷和用藥,可以獲得新的思路,并且為完善我們現(xiàn)有的中醫(yī)理論基礎(chǔ)可以提供可靠的理論支持。采用數(shù)據(jù)挖掘技術(shù)對中醫(yī)學(xué)術(shù)思想和臨證經(jīng)驗進行研究,可以全面解析其中的規(guī)律,分析中醫(yī)個體化診療信息特征,提煉出臨證經(jīng)驗中蘊藏的新理論、新力法,可以實現(xiàn)經(jīng)驗的有效總結(jié)與傳承[11]。與此同時,要求我們用發(fā)展的眼光將現(xiàn)代的科技手段整合加入到傳統(tǒng)的中醫(yī)學(xué)理論中去,推陳出新,通過臨床實踐與基礎(chǔ)理論的不斷結(jié)合,不斷完善,推動祖國醫(yī)學(xué)現(xiàn)代化,譜寫有關(guān)于中醫(yī)學(xué)在轉(zhuǎn)化醫(yī)學(xué)上新的篇章。
參考文獻
[1]劉向哲.中醫(yī)理論創(chuàng)新與發(fā)展的基礎(chǔ)和機遇[J].中醫(yī)學(xué)報,2010,25(5):884-885.
[2]邱仕君,吳玉生.在基礎(chǔ)理論與臨床醫(yī)學(xué)之間———對鄧鐵濤教授五臟相關(guān)學(xué)說的理論思考[J].湖北民族學(xué)院學(xué)報(醫(yī)學(xué)版),2005,22(2):36-39.
[3]顧寧,周仲英.通下法治療急性腦出血研究進展[J].中國中醫(yī)急診,2000,9(5):227.
[4]靳士英.鄧鐵濤教授學(xué)術(shù)成就管[J].現(xiàn)代醫(yī)院,2004(9):1-6.
[5]許前磊,徐立然,郭會軍,等.艾滋病發(fā)病與防治中醫(yī)理論的初步構(gòu)建[J].中醫(yī)雜志,2015,56(11):909-911.
[6]張少聰,周偉生.名老中醫(yī)驗方治療輸卵管阻塞性不孕癥概況[J].中華中醫(yī)藥學(xué)刊,2010(3):489-491.
[7]孟靜巖,應(yīng)森林.試論中醫(yī)基礎(chǔ)理論指導(dǎo)臨床研究的思考與途徑[J].上海中醫(yī)藥大學(xué)學(xué)報,2009(3):3-5.
[8]邢玉瑞.新形勢下中醫(yī)理論發(fā)展的思考[J].中醫(yī)雜志,2016,57(18):1540-1542.
[9]盧峰,聶達榮,彭美玉,等.中醫(yī)內(nèi)科學(xué)應(yīng)用名老中醫(yī)病案教學(xué)法的探索[J].中國中醫(yī)藥現(xiàn)代遠程教育,2014(18):80-82.
[10]郭軍.基于數(shù)據(jù)挖掘分析前名老中醫(yī)病案整理的思路與方法[J].中醫(yī)藥信息,2011,28(2):49-50.
[11]吳嘉瑞,唐仕歡,郭位先,等.基于數(shù)據(jù)挖掘的名老中醫(yī)經(jīng)驗傳承研究述評[J].中國中藥雜志,2014,39(4):614-617.
數(shù)據(jù)挖掘論文10
摘要:近年來,數(shù)據(jù)庫挖掘技術(shù)的普遍應(yīng)用,使數(shù)據(jù)價值實現(xiàn)最大化,在我國金融、商業(yè)、市場營銷等領(lǐng)域得到廣泛應(yīng)用。然而在我國高校管理中并沒有得到推廣,為使高校管理系統(tǒng)中的數(shù)據(jù)充分發(fā)揮應(yīng)有價值,在該系統(tǒng)中使用數(shù)據(jù)庫挖掘技術(shù)意義深遠。本文首先介紹了數(shù)據(jù)挖掘技術(shù)的流程,然后在教師教學(xué)質(zhì)量評估中應(yīng)用數(shù)據(jù)庫挖掘技術(shù),充分證明數(shù)據(jù)庫挖掘技術(shù)在高校管理中能發(fā)揮重大作用。
關(guān)鍵詞:管理 決策 數(shù)據(jù)挖掘技術(shù)
當前,大部分高校都擁有配套的管理系統(tǒng),該系統(tǒng)具備海量數(shù)據(jù)儲存和管理功能,徹底告別了手工記錄信息和數(shù)據(jù)的年代。不但節(jié)約了紙張,更有效提高了高校管理數(shù)據(jù)和信息的效率。然而我國高校沒有有效利用應(yīng)用數(shù)據(jù)挖掘技術(shù),因此研究數(shù)據(jù)庫挖掘技術(shù)在高校管理中的應(yīng)用十分必要。
1數(shù)據(jù)挖掘技術(shù)的流程
數(shù)據(jù)挖掘技術(shù)能夠?qū)⒑A繑?shù)據(jù)展開分析和處理,再把整體數(shù)據(jù)庫中存在規(guī)律的數(shù)據(jù)整合起來,實施該技術(shù)主要包括以下五個環(huán)節(jié)。目標定義:該環(huán)節(jié)中要與有關(guān)領(lǐng)域的背景知識相結(jié)合,清晰、精確的定義出數(shù)據(jù)挖掘目標。數(shù)據(jù)準備:在該環(huán)節(jié)中要搜集、選取數(shù)據(jù)源中的數(shù)據(jù),處理已選數(shù)據(jù),將其轉(zhuǎn)換為適合數(shù)據(jù)挖掘的形態(tài)。數(shù)據(jù)挖掘:該環(huán)節(jié)是數(shù)據(jù)挖掘技術(shù)的核心,即采用關(guān)聯(lián)規(guī)則法、分類分析法等各種數(shù)據(jù)挖掘方法把數(shù)據(jù)中隱藏的知識和規(guī)律發(fā)掘出來。結(jié)果表示:在該環(huán)節(jié)中可以以用戶需求為依據(jù),將挖掘出來的知識和規(guī)律轉(zhuǎn)變?yōu)橛脩裟芙邮芎屠斫獾男螒B(tài)。知識吸收:該環(huán)節(jié)中,主要是把挖掘結(jié)果與指定領(lǐng)域中的需求相結(jié)合,在該領(lǐng)域中應(yīng)用發(fā)掘出來的結(jié)果,為決策者提供知識,是數(shù)據(jù)挖掘的終極目標。
2數(shù)據(jù)挖掘技術(shù)在教學(xué)質(zhì)量評估中的應(yīng)用
2。1運用關(guān)聯(lián)規(guī)則法挖掘數(shù)據(jù)庫中的信息
評估老師教學(xué)質(zhì)量不但是評定教學(xué)效果的`重要部分,也是評定教師職稱的重要根據(jù),因此是高校管理工作中不可或缺的部分。目前評估教學(xué)質(zhì)量的主要措施是搜集、統(tǒng)計學(xué)生的成績和以及對老師的評價,然后加權(quán)算出老師的總得分,作為評估該老師教學(xué)質(zhì)量指標。這種方法非但不科學(xué),其權(quán)威性也較低,因此需要深挖數(shù)據(jù)的相關(guān)性,本文采用了數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)法挖掘數(shù)據(jù)中的規(guī)律和知識,為評估老師教學(xué)質(zhì)量提供有力根據(jù)。運用關(guān)聯(lián)規(guī)則法挖掘數(shù)據(jù),其規(guī)則方法為“XY,置信度為c%,,支持度為s%”。關(guān)聯(lián)規(guī)則中置信度為c%:在整體事件D集合中,如果既能夠符合事件X中擁有c%的需求,也能夠符合Y的要求。那么就用置信度來表示關(guān)聯(lián)規(guī)則的強度,被記錄為confidence(XY),置信度最小值用minConf來表示,通常置信度最小數(shù)值由客戶提供。關(guān)聯(lián)規(guī)則中置信度為s%:在整體事件D集合中,如果既能夠符合事件Y中的s%的需求,又能夠符合X要求。用支持度來表示關(guān)聯(lián)規(guī)則的頻度,把支持度的最小數(shù)記錄用minsup(X)來表示,通常支持度最小數(shù)值由客戶提供。頻繁項集合:當X項集的支持度大于等于用戶設(shè)定好的最小支持度時,那么頻繁項集是X。通常關(guān)聯(lián)規(guī)則包含兩個環(huán)節(jié):①把全部頻繁項集從整體事件集中選出;②運用頻繁項集產(chǎn)生關(guān)聯(lián)規(guī)則。在這兩個環(huán)節(jié)中關(guān)聯(lián)規(guī)則效果和性能是否良好取決于第一個環(huán)節(jié)。
2。2關(guān)聯(lián)規(guī)則分析在評估教學(xué)質(zhì)量中的運用
第一步是準備數(shù)據(jù)期,在某大學(xué)的教學(xué)管理系統(tǒng)中將五百條與教學(xué)評價有關(guān)的記錄從數(shù)據(jù)庫中隨機抽取,并挑選出老師編號、學(xué)歷、性別、教齡、評估分和職稱這六個屬性,并將相關(guān)數(shù)據(jù)從數(shù)據(jù)庫中提取。比如把講師、副教授和教授等職稱轉(zhuǎn)化成11、01、00等編碼,表1就是制定的評價教師教學(xué)記錄表。第二步采用關(guān)聯(lián)規(guī)則分析法把90分以上評價分數(shù)作為檢索目標和判斷標準,也就是將≥90分作為判斷是否是高教學(xué)質(zhì)量闕值。通過檢索有143條記錄符合標準,即設(shè)定最小的支持度為10%,置信度則為15%,得出下表2的關(guān)聯(lián)規(guī)則。最后一步評價本次實驗的結(jié)果。由上表得知,學(xué)生喜歡男老師和女老師的程度大致相同;學(xué)歷愈高的老師,給予他們的教學(xué)評價也就愈高,即學(xué)歷和教學(xué)評價成正比,這也說明了學(xué)歷高的老師其基本功與學(xué)歷低的老師相比,前者基本功更為穩(wěn)固,也有較高的科學(xué)研究水平;有較長教齡和較高職稱的老師,其教學(xué)質(zhì)量也越高;此外,在支持度中可以看出,高校教授和高學(xué)歷人才越多,說明其辦學(xué)能力也就越高。
3結(jié)語
高校管理系統(tǒng)作為教學(xué)信息化的重要舉措,只是起到搜集和儲存海量教學(xué)信息的作用,并沒有挖掘出海量數(shù)據(jù)之間的相關(guān)性,而在本文中把關(guān)聯(lián)規(guī)則法運用在教師教學(xué)質(zhì)量評估中,在數(shù)據(jù)中挖掘有價值的知識和規(guī)律,使評估教師教學(xué)質(zhì)量更具有科學(xué)性,因此在高校管理中全面應(yīng)用數(shù)據(jù)挖掘技術(shù),能為高校深化教學(xué)改革提供新的契機。
參考文獻
[1]江敏,徐艷。數(shù)據(jù)挖掘技術(shù)在高校教學(xué)管理中的應(yīng)用[J]。電腦知識與技術(shù),20xx,(24):541—545+560。
[2]楊雪霞。數(shù)據(jù)挖掘技術(shù)在高校圖書館管理系統(tǒng)中的應(yīng)用研究[J]。軟件,20xx(04):16—18。
數(shù)據(jù)挖掘論文11
網(wǎng)絡(luò)經(jīng)濟的關(guān)鍵在于能夠為商品的供應(yīng)商及其合作者之間提供一個交流的平臺,但是即便是最權(quán)威的搜索引擎也只能夠搜索到三分之一的web網(wǎng)頁,并且這些Web都是沒有結(jié)構(gòu)的、動態(tài)的、復(fù)雜的形式出現(xiàn)。人們要從各種各樣的文本網(wǎng)站中尋找自己想要的信息進而變得更加困難。網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)就是用來解決這一問題的好辦法,利用數(shù)據(jù)挖掘技術(shù)能夠有效發(fā)現(xiàn)在web網(wǎng)頁中隱藏著的對用戶有力的數(shù)據(jù)信息,在對數(shù)據(jù)的分析中總結(jié)出規(guī)律。如何實現(xiàn)用戶對于Web上的有效數(shù)據(jù)的深度挖掘,使其成為工商管理領(lǐng)域中的重要應(yīng)用,成為了當代許多網(wǎng)絡(luò)工作者所關(guān)注的話題。
一、數(shù)據(jù)挖掘概述
。ㄒ唬⿺(shù)據(jù)挖掘
數(shù)據(jù)挖掘(DataMining)指的是,在大量的、不規(guī)則的、隨機的、復(fù)雜的、有噪聲的實際應(yīng)用數(shù)據(jù)中,獲得一些信息和知識,能夠?qū)τ脩羝矶\潛在作用的效果的過程。將數(shù)據(jù)挖掘用通俗的話來描述就是在數(shù)據(jù)庫中發(fā)現(xiàn)潛在有用的知識發(fā)現(xiàn)(KDDKnowledgeDiscoveryinDatabase)。在這個定義中主要包含了以下幾方面的含義:首先數(shù)據(jù)源的特性是大量、隨機、不規(guī)則、噪聲;信息是客戶所感興趣的對象;選取的知識必須是在可接受、可理解、可運用的范圍內(nèi)的,并不是全部符合要求的都可以,對于問題要有一定的針對性。也就是說對于所發(fā)現(xiàn)的知識的篩選是有一定的約束和限制條件的,同時也要符合用戶的理解和學(xué)習能力,最好還能夠用通俗的語言來表達最終的結(jié)果。
。ǘ¦eb數(shù)據(jù)挖掘
Web數(shù)據(jù)挖掘?qū)嶋H上是屬于數(shù)據(jù)挖掘的范疇的。概括的來說,Web數(shù)據(jù)挖掘的數(shù)據(jù)庫特定的就是Web服務(wù)器上的數(shù)據(jù)文件,從中發(fā)現(xiàn)用戶感興趣并有所應(yīng)用潛能的知識。Web數(shù)據(jù)挖掘主要針對的就是頁面內(nèi)容、頁面之間的結(jié)構(gòu)、用戶訪問信息、電子商務(wù)等內(nèi)在信息,通過數(shù)據(jù)挖掘技術(shù)來獲得有價值的信息。Web數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)庫存在著很大的差異,傳統(tǒng)的數(shù)據(jù)庫都是在一定的數(shù)學(xué)模型范圍之內(nèi)的,通過模型來描述其中的數(shù)據(jù);但是web數(shù)據(jù)庫相對來講就要復(fù)雜許多,沒有通用的模型來描述數(shù)據(jù),每個網(wǎng)頁都有其獨特的數(shù)據(jù)描述方式,丙炔數(shù)據(jù)自身都是可變的、動態(tài)的。因而,Web數(shù)據(jù)雖然具有一定的結(jié)構(gòu)性,不能用架構(gòu)化的形式來表達,也可以稱其為半結(jié)構(gòu)化的數(shù)據(jù)。Web數(shù)據(jù)的最大特點就是半結(jié)構(gòu)化,加上Web數(shù)據(jù)的信息量極大,導(dǎo)致整一個數(shù)據(jù)庫成為一個巨大的異構(gòu)數(shù)據(jù)庫。
二、網(wǎng)絡(luò)數(shù)據(jù)挖掘的類型
。ㄒ唬┚W(wǎng)絡(luò)內(nèi)容挖掘
網(wǎng)絡(luò)內(nèi)容挖掘的對象是網(wǎng)頁的內(nèi)容、數(shù)據(jù)、文檔,這通常也是網(wǎng)頁在急性搜索的時候需要考察的訪問對象。由于網(wǎng)絡(luò)信息繁多,按照信息源的不同可以劃分為Gopher、FTP、Usenet等已經(jīng)隱藏到WWW形式之后的資源,我們稱之為WWW信息資源,存儲于數(shù)據(jù)庫管理信息系統(tǒng)中的數(shù)據(jù),以及不能直接訪問的私人數(shù)據(jù)。按照網(wǎng)絡(luò)資源的形式又可以劃分為文本、圖像、音頻、視頻等數(shù)據(jù)。
(二)網(wǎng)絡(luò)結(jié)構(gòu)挖掘
網(wǎng)絡(luò)結(jié)構(gòu)挖掘的對象就是Web潛在的鏈接結(jié)構(gòu)模式。這種類型最早出現(xiàn)在引文分析,在建立web自身的鏈接結(jié)構(gòu)模型的時候借鑒了網(wǎng)頁鏈接和被鏈接數(shù)量以及對象。在網(wǎng)頁歸類的時候往往會采用這種模式,還能夠得到不同網(wǎng)頁間相似度及關(guān)聯(lián)度的相關(guān)數(shù)據(jù)。網(wǎng)絡(luò)結(jié)構(gòu)挖掘能夠幫助用戶在相關(guān)領(lǐng)域中找到最有分量的網(wǎng)站。
。ㄈ┚W(wǎng)絡(luò)用法挖掘
網(wǎng)絡(luò)用法挖掘的目的在于掌握用戶的一系列網(wǎng)絡(luò)行為數(shù)據(jù)。網(wǎng)絡(luò)內(nèi)容挖掘、網(wǎng)絡(luò)結(jié)構(gòu)挖掘針對的都是網(wǎng)上的原始數(shù)據(jù),而網(wǎng)絡(luò)用法挖掘針對的是用戶在上網(wǎng)過程中的人機交互的第二手數(shù)據(jù),主要有用戶的`網(wǎng)頁游覽記錄、代理服務(wù)器日志記錄、網(wǎng)頁維護信息、用戶簡介、注冊信息、聊天記錄、交易信息等等。
三、網(wǎng)絡(luò)經(jīng)濟環(huán)境下數(shù)據(jù)挖掘在工商管理中的運用步驟
。ㄒ唬┳R別網(wǎng)站訪問者的特征信息
企業(yè)對電子商務(wù)網(wǎng)站的數(shù)據(jù)進行挖掘的第一步,就是要明確訪問者的特點,找出訪問者使用的條款特征。訪問者特征主要有入口統(tǒng)計、心理狀態(tài)和技術(shù)手段等要素。人口統(tǒng)計并不是一成不變的,比如家庭地址、收入、購買力等因素都會不斷改變。心理狀態(tài)指的是在心理調(diào)研中展現(xiàn)出的個性類型,比如對商品的選擇去世、價格優(yōu)惠心理、技術(shù)興趣等。隨著訪問者數(shù)量的增加,相關(guān)數(shù)據(jù)也會不斷累積。條款的交互信息主要包括購買歷史、廣告歷史和優(yōu)選信息。網(wǎng)站統(tǒng)計信息是指每次會話的相關(guān)要素。公司信息主要包括訪問者對接的服務(wù)器所包含的一系列要素信息。
。ǘ┲贫繕
開展網(wǎng)上交易的最大優(yōu)勢在于企業(yè)對于訪問者的反應(yīng)有著更好的前瞻性。當廠商的目標是明確且具象的時候,就能夠通過數(shù)據(jù)挖掘技術(shù)得到較好的效果。企業(yè)通?梢栽O(shè)定以下的目標:網(wǎng)頁訪問者的增加量;類此網(wǎng)頁訪問的瀏覽時間增加;每次結(jié)賬的平均利潤;退換貨的減少;品牌知名度效應(yīng);回頭客的數(shù)量等等。
(三)問題描述
開展電子商務(wù)的企業(yè)最關(guān)鍵要面對的一個問題就是如何進行商品的傳播,要實現(xiàn)網(wǎng)頁的個性化又要將商品的信息完整的展現(xiàn)給顧客,就需要了解同一類訪問者的共有特征、估計貨物丟失的數(shù)據(jù)并預(yù)測未來行為。所有這一切都涉及尋找并支持各種不同的隱含模式。
。ㄋ模╆P(guān)聯(lián)分析
對顧客大量的交易數(shù)據(jù)進行關(guān)聯(lián)規(guī)則分析,能夠發(fā)現(xiàn)顧客購買組合商品的趨勢。關(guān)聯(lián)分析指的是在一次瀏覽或者會話中所涉及到的商品,也叫做市場分析。若電子商務(wù)網(wǎng)站能夠?qū)⑦@些商品放在同一個網(wǎng)頁中,就能夠提高顧客同時購買這些商品的概率。如果在關(guān)聯(lián)的一組商品中有某一項商品正在進行促銷,就能夠帶動其他組合產(chǎn)品的銷量。關(guān)聯(lián)也能夠用在靜態(tài)的網(wǎng)站目錄網(wǎng)頁。在這種情況下,網(wǎng)站排序的主要依據(jù)是廠商選擇的且是網(wǎng)站所要查看的第一頁內(nèi)容,將其以及其相關(guān)的商品信息放在網(wǎng)頁的首頁。
。ㄎ澹┚垲
聚類指的是將具有相同特征的商品歸為一類,將特征平均,以形成一個“特征矢量”。聚類技術(shù)能夠確定一組數(shù)據(jù)有多少類,并用其中一個聚類來表示其余大多數(shù)數(shù)據(jù)。通常在企業(yè)分析訪問者類型的時候使用聚類技術(shù)。
。Q策樹
決策樹描繪的是都想決定在做出的一系列過程中的問題或數(shù)據(jù)點。比如做出購買電視機這一決定就要經(jīng)歷對于電視機的需求、電視機的品牌、尺寸等等問題,最終確定好買哪一臺電視機為止。決策樹能夠較一個決策過程進行系統(tǒng)的排序,以便選出最優(yōu)的路徑來盡可能減少決策的步驟,提高決定的質(zhì)量和速度。許多企業(yè)將決策樹體系添加到自己的產(chǎn)品選擇系統(tǒng)中,能夠幫助訪問者解決特定問題。
(七)估計和預(yù)測
估計是對未知量的判斷,預(yù)測是根據(jù)當前的趨勢做出將來的判斷。估計和預(yù)測使用的算法類似。估計能夠?qū)蛻艨瞻椎捻椖孔龅筋A(yù)判。如果網(wǎng)站想知道某個訪問者的收入,就可以通過與收入密切相關(guān)的量估計得到,最后通過與其有相同特征的訪問者的收入來衡量這個訪問者的收入和信用值。預(yù)測是對未來事項的判斷。尤其是在某些個性化網(wǎng)頁中顯得尤為重要。企業(yè)通過數(shù)據(jù)的匯總增進對客戶的了解。即使是對以往事件的分析中也可以得到有效的信息。預(yù)測能夠?qū)υL問者的特征作出總結(jié)和匯總,以便企業(yè)能夠找出更有針對性的組合商品來滿足客戶的需求。Web數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)庫存在著很大的差異,最大特點就是半結(jié)構(gòu)化,加上Web數(shù)據(jù)的信息量極大,導(dǎo)致整一個數(shù)據(jù)庫成為一個巨大的異構(gòu)數(shù)據(jù)庫。能夠幫助用戶在特性是大量、隨機、不規(guī)則、噪聲的信息中發(fā)現(xiàn)感興趣的對象。
數(shù)據(jù)挖掘論文12
隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,尤其移動互聯(lián)網(wǎng)的爆發(fā)性發(fā)展,越來越多的公司憑借其備受歡迎的系統(tǒng)和APP如雨后春筍般發(fā)展起來,如滴滴打車、共享單車等。海量數(shù)據(jù)自此不再是Google等大公司的專利,越來越多的中小型企業(yè)也可以擁有海量數(shù)據(jù)。如何從浩如煙海的數(shù)據(jù)中挖掘出令人感興趣和有用的知識,成為越來越多的公司急需解決的問題。因此,他們對數(shù)據(jù)挖掘分析師求賢若渴。在這一社會需求下,培養(yǎng)出優(yōu)秀的數(shù)據(jù)挖掘分析師,是各個高校目前急需完成的一項任務(wù)。
一、教學(xué)現(xiàn)狀反思
目前,各大高等院校本科階段爭相開設(shè)數(shù)據(jù)挖掘課程。然而,該課程是一門相對較新的交叉學(xué)科,涵蓋了概率統(tǒng)計、機器學(xué)習、數(shù)據(jù)庫等學(xué)科的知識內(nèi)容,難度較大。因此,大部分高校一般將此課程開設(shè)在研究生階段,在本科生中開設(shè)此課程的學(xué)校相對較少。另外,不同的學(xué)校將其歸入不同的專業(yè)中,如計算機專業(yè)、信息管理專業(yè)、統(tǒng)計學(xué)、醫(yī)學(xué)等?梢哉f,這一課程基本上處于探索的過程中。我院災(zāi)害信息系于20xx年在信息管理與信息系統(tǒng)本科學(xué)生中首次開設(shè)了該課程。通過開設(shè)此課程,學(xué)生能夠掌握數(shù)據(jù)挖掘的基本原理和各種挖掘算法等,掌握數(shù)據(jù)分析和處理、高級數(shù)據(jù)庫編程等技能,達到數(shù)據(jù)聚類、分類、關(guān)聯(lián)分析的目的。然而,通過前期教學(xué)過程,我們發(fā)現(xiàn)教學(xué)效果不理想,存在很多問題。
1.數(shù)據(jù)內(nèi)驅(qū)力差
以往數(shù)據(jù)挖掘課程重點講授數(shù)據(jù)挖掘算法,對數(shù)據(jù)源的獲取和處理極少獲取。目前各大教材都在使用一些公共數(shù)據(jù)資源,這些數(shù)據(jù)資源有些已經(jīng)非常陳舊了,比如20世紀80年代的加州房價數(shù)據(jù)。這些數(shù)據(jù)脫離現(xiàn)實,分析這些數(shù)據(jù),學(xué)生沒有任何興趣和學(xué)習動力,也就無法發(fā)現(xiàn)價值。
2.過于強調(diào)學(xué)習數(shù)據(jù)挖掘理論及算法的學(xué)習
大量具有難度的數(shù)據(jù)挖掘算法的學(xué)習,使學(xué)生喪失了學(xué)習興趣,學(xué)完即忘,不知所用。
3.忽視對數(shù)據(jù)預(yù)處理過程的學(xué)習
以往所使用的公共數(shù)據(jù)源或軟件自帶數(shù)據(jù)源,數(shù)據(jù)量小,需要的預(yù)處理工作比較少;這部分內(nèi)容基本只安排一次理論課、一次實驗課。而實際通過爬蟲獲取的數(shù)據(jù)源數(shù)據(jù)量大;這部分工作量比較大,需要占到整個數(shù)據(jù)挖掘工作量的一半以上。因此,一次理論課和一次實驗課是無法讓學(xué)生掌握數(shù)據(jù)預(yù)處理技能的'。
4.算法編程實現(xiàn)難度較大
要求學(xué)生學(xué)習一門新的編程語言,如R語言、Python語言,對本科非計算機專業(yè)的學(xué)生來說難度是非常大的,尤其是課時安排只有48課時。
5.數(shù)據(jù)挖掘分析及應(yīng)用技能較差
學(xué)生能夠理解課堂案例,但在實際應(yīng)用中,無法完成整個數(shù)據(jù)分析流程。
二、數(shù)據(jù)挖掘課程改革
該課程的教學(xué)對象是信息管理與信息系統(tǒng)專業(yè)本科大四學(xué)生。因此,培養(yǎng)實際應(yīng)用人才,使其完成整個實際數(shù)據(jù)挖掘分析流程是教師的教學(xué)目的。筆者對智聯(lián)招聘、中華英才網(wǎng)、51job等幾個大型招聘網(wǎng)站的幾百個數(shù)據(jù)挖掘分析師相關(guān)職位進行分析,主要分析了相關(guān)職位的工作內(nèi)容、職位要求以及需求企業(yè)。數(shù)據(jù)分析師主要利用數(shù)據(jù)挖掘工具對運營數(shù)據(jù)等多種數(shù)據(jù)源進行預(yù)處理、建模、挖掘、分析及優(yōu)化。該職位是受業(yè)務(wù)驅(qū)動的,特點是將現(xiàn)有數(shù)據(jù)與業(yè)務(wù)相結(jié)合,最大程度地變現(xiàn)數(shù)據(jù)價值。該職位對計算機編程等相關(guān)技術(shù)不作要求,但是需要有深厚的數(shù)據(jù)挖掘理論基礎(chǔ),熟練使用主流的數(shù)據(jù)挖掘(或統(tǒng)計分析)工具;诖,教師可以采取以下策略進行教學(xué)改革。
1.加強對業(yè)務(wù)數(shù)據(jù)的理解
數(shù)據(jù)挖掘分析師是受業(yè)務(wù)驅(qū)動的,所以要理解實際業(yè)務(wù),明確本次數(shù)據(jù)挖掘要解決什么問題。教師可以構(gòu)建案例庫,包括教師案例庫、學(xué)生討論案例庫。教師案例庫由教師構(gòu)建,可用于課堂講授。學(xué)生案例庫由學(xué)生分組構(gòu)建,并安排討論課,由學(xué)生講述、討論并提交報告。
2.加強對數(shù)據(jù)的獲取
對學(xué)生感興趣的數(shù)據(jù)源進行挖掘,這樣才能更好地幫助學(xué)生理解吸收知識。因此,可以教授學(xué)生爬蟲技術(shù),編寫爬蟲程序,使其自主獲取感興趣的數(shù)據(jù)。
3.加強對數(shù)據(jù)的預(yù)處理工作
在數(shù)據(jù)挖掘之前使用數(shù)據(jù)預(yù)處理技術(shù),能夠顯著提高數(shù)據(jù)挖掘模式的質(zhì)量,降低實際挖掘所需要的時間,應(yīng)將其作為整門課程的重點進行學(xué)習。增加理論課程和實驗課時,使學(xué)生掌握數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換、數(shù)據(jù)歸納等數(shù)據(jù)預(yù)處理技術(shù),并能夠應(yīng)對各種復(fù)雜數(shù)據(jù)源,最終利用爬蟲程序獲取的各種數(shù)據(jù)源進行預(yù)處理工作。
4.強化數(shù)據(jù)挖掘分析
教師可以選擇SPSS Modeler這款所見即所得的數(shù)據(jù)挖掘軟件作為配套實驗平臺。該軟件具有必需的數(shù)據(jù)預(yù)處理工具及預(yù)設(shè)的挖掘算法,學(xué)生可以把注意力放在要挖掘的數(shù)據(jù)及相關(guān)需求上,設(shè)定挖掘的主題,然后通過鼠標的點擊拖拉即可完成相關(guān)主題的數(shù)據(jù)挖掘過程。學(xué)生最終可對自己獲取并已處理過的數(shù)據(jù)進行挖掘分析。
5.加強教師外出培訓(xùn)學(xué)習
數(shù)據(jù)挖掘技術(shù)以及大數(shù)據(jù)技術(shù)是近來比較新穎而且發(fā)展迅速的技術(shù)。教師長期身處三尺講臺之上,遠離了新技術(shù),脫離了實際。因此,需派遣教師到知名高校學(xué)習數(shù)據(jù)挖掘教學(xué)技術(shù),到培訓(xùn)機構(gòu)進行系統(tǒng)學(xué)習,到企業(yè)進行實戰(zhàn)學(xué)習。
基于以上分析,形成了新的數(shù)據(jù)挖掘理論課程內(nèi)容和實踐課程內(nèi)容,安排如表1和表2所示。共安排48學(xué)時,其中理論課24學(xué)時,實驗課24學(xué)時。理論課重點講授數(shù)據(jù)的獲取、數(shù)據(jù)的理解、數(shù)據(jù)的預(yù)處理以及常用挖掘算法。實驗課重點學(xué)習基于SPSS modeler的數(shù)據(jù)挖掘,對理論課的內(nèi)容進行實踐。整個學(xué)習以工程項目為載體,該工程貫穿整個學(xué)習過程。學(xué)生通過爬蟲程序獲取自己感興趣的數(shù)據(jù)源,根據(jù)課程進度,逐步完成后續(xù)數(shù)據(jù)的理解,再進行預(yù)處理,建模分析,評估整個過程。在課程結(jié)束時,完成整個項目,并提交報告。
三、結(jié)論
在數(shù)字時代,越來越多的企業(yè)急需數(shù)據(jù)挖掘分析人才。教師應(yīng)以培養(yǎng)實際應(yīng)用人才為目的,充分培養(yǎng)學(xué)生對數(shù)據(jù)挖掘的學(xué)習興趣,以工程項目為載體,貫穿整個課程周期。在教學(xué)中,打牢數(shù)據(jù)獲取、理解預(yù)處理這一基石,加強建模挖掘分析,弱化對晦澀算法的編程學(xué)習,使學(xué)生真正掌握數(shù)據(jù)挖掘技術(shù),滿足社會需求。
參考文獻:
[1]李海林.大數(shù)據(jù)環(huán)境下的數(shù)據(jù)挖掘課程教學(xué)探索[J].計算機時代,20xx(2):54-55.
[2]宋威,李晉宏.項目驅(qū)動的數(shù)據(jù)挖掘教學(xué)模式探討[J].中國電力教育,20xx(27):116-177.
[3]徐琴.應(yīng)用型本科數(shù)據(jù)挖掘技術(shù)課程教學(xué)探討與實踐[J].電腦知識與技術(shù),20xx,12(8):148-149.
[4]李姍姍,李忠.就業(yè)需求驅(qū)動下的本科院校數(shù)據(jù)挖掘課程內(nèi)容體系探討[J].計算機時代,20xx(2):60-61.
數(shù)據(jù)挖掘論文13
題目:大數(shù)據(jù)挖掘在智游應(yīng)用中的探究
摘要:大數(shù)據(jù)和智游都是當下的熱點, 沒有大數(shù)據(jù)的智游無從談“智慧”, 數(shù)據(jù)挖掘是大數(shù)據(jù)應(yīng)用于智游的核心, 文章探究了在智游應(yīng)用中, 目前大數(shù)據(jù)挖掘存在的幾個問題。
關(guān)鍵詞:大數(shù)據(jù); 智游; 數(shù)據(jù)挖掘;
1引言
隨著人民生活水平的進一步提高, 旅游消費的需求進一步上升, 在云計算、互聯(lián)網(wǎng)、物聯(lián)網(wǎng)以及移動智能終端等信息通訊技術(shù)的飛速發(fā)展下, 智游應(yīng)運而生。大數(shù)據(jù)作為當下的熱點已經(jīng)成了智游發(fā)展的有力支撐, 沒有大數(shù)據(jù)提供的有利信息, 智游無法變得“智慧”。
2大數(shù)據(jù)與智游
旅游業(yè)是信息密、綜合性強、信息依存度高的產(chǎn)業(yè)[1], 這讓其與大數(shù)據(jù)自然產(chǎn)生了交匯。2010年, 江蘇省鎮(zhèn)江市首先提出“智游”的概念, 雖然至今國內(nèi)外對于智游還沒有一個統(tǒng)一的學(xué)術(shù)定義, 但在與大數(shù)據(jù)相關(guān)的描述中, 有學(xué)者從大數(shù)據(jù)挖掘在智游中的作用出發(fā), 把智游描述為:通過充分收集和管理所有類型和來源的旅游數(shù)據(jù), 并深入挖掘這些數(shù)據(jù)的潛在重要價值信息, 然后利用這些信息為相關(guān)部門或?qū)ο筇峁┓⻊?wù)[2]。這一定義充分肯定了在發(fā)展智游中, 大數(shù)據(jù)挖掘所起的至關(guān)重要的作用, 指出了在智游的過程中, 數(shù)據(jù)的收集、儲存、管理都是為數(shù)據(jù)挖掘服務(wù), 智游最終所需要的是利用挖掘所得的有用信息。
3大數(shù)據(jù)挖掘在智游中存在的問題
2011年, 我國提出用十年時間基本實現(xiàn)智游的目標[3], 過去幾年, 國家旅游局的相關(guān)動作均為了實現(xiàn)這一目標。但是, 在借助大數(shù)據(jù)推動智游的可持續(xù)性發(fā)展中, 大數(shù)據(jù)所產(chǎn)生的價值卻亟待提高, 原因之一就是在收集、儲存了大量數(shù)據(jù)后, 對它們深入挖掘不夠, 沒有發(fā)掘出數(shù)據(jù)更多的價值。
3.1 信息化建設(shè)
智游的發(fā)展離不開移動網(wǎng)絡(luò)、物聯(lián)網(wǎng)、云平臺。隨著大數(shù)據(jù)的不斷發(fā)展, 國內(nèi)許多景區(qū)已經(jīng)實現(xiàn)Wi-Fi覆蓋, 部分景區(qū)也已實現(xiàn)人與人、人與物、人與景點之間的實時互動, 多省市已建有旅游產(chǎn)業(yè)監(jiān)測平臺或旅游大數(shù)據(jù)中心以及數(shù)據(jù)可視化平臺, 從中進行數(shù)據(jù)統(tǒng)計、行為分析、監(jiān)控預(yù)警、服務(wù)質(zhì)量監(jiān)督等。通過這些平臺, 已基本能掌握跟游客和景點相關(guān)的數(shù)據(jù), 可以實現(xiàn)更好旅游監(jiān)控、產(chǎn)業(yè)宏觀監(jiān)控, 對該地的旅游管理和推廣都能發(fā)揮重要作用。
但從智慧化的發(fā)展來看, 我國的信息化建設(shè)還需加強。雖然通訊網(wǎng)絡(luò)已基本能保證, 但是大部分景區(qū)還無法實現(xiàn)對景區(qū)全面、透徹、及時的感知, 更為困難的是對平臺的建設(shè)。在數(shù)據(jù)共享平臺的建設(shè)上, 除了必備的硬件設(shè)施, 大數(shù)據(jù)實驗平臺還涉及大量部門, 如政府管理部門、氣象部門、交通、電子商務(wù)、旅行社、旅游網(wǎng)站等。如此多的部門相關(guān)聯(lián), 要想建立一個完整全面的`大數(shù)據(jù)實驗平臺, 難度可想而知。
3.2 大數(shù)據(jù)挖掘方法
大數(shù)據(jù)時代缺的不是數(shù)據(jù), 而是方法。大數(shù)據(jù)在旅游行業(yè)的應(yīng)用前景非常廣闊, 但是面對大量的數(shù)據(jù), 不懂如何收集有用的數(shù)據(jù)、不懂如何對數(shù)據(jù)進行挖掘和利用, 那么“大數(shù)據(jù)”猶如礦山之中的廢石。旅游行業(yè)所涉及的結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù), 通過云計算技術(shù), 對數(shù)據(jù)的收集、存儲都較為容易, 但對數(shù)據(jù)的挖掘分析則還在不斷探索中。大數(shù)據(jù)的挖掘常用的方法有關(guān)聯(lián)分析, 相似度分析, 距離分析, 聚類分析等等, 這些方法從不同的角度對數(shù)據(jù)進行挖掘。其中, 相關(guān)性分析方法通過關(guān)聯(lián)多個數(shù)據(jù)來源, 挖掘數(shù)據(jù)價值。但針對旅游數(shù)據(jù), 采用這些方法挖掘數(shù)據(jù)的價值信息, 難度也很大, 因為旅游數(shù)據(jù)中冗余數(shù)據(jù)很多, 數(shù)據(jù)存在形式很復(fù)雜。在旅游非結(jié)構(gòu)化數(shù)據(jù)中, 一張圖片、一個天氣變化、一次輿情評價等都將會對游客的旅行計劃帶來影響。對這些數(shù)據(jù)完全挖掘分析, 對游客“行前、行中、行后”大數(shù)據(jù)的實時性挖掘都是很大的挑戰(zhàn)。
3.3 數(shù)據(jù)安全
2017年, 數(shù)據(jù)安全事件屢見不鮮, 伴著大數(shù)據(jù)而來的數(shù)據(jù)安全問題日益凸顯出來。在大數(shù)據(jù)時代, 無處不在的數(shù)據(jù)收集技術(shù)使我們的個人信息在所關(guān)聯(lián)的數(shù)據(jù)中心留下痕跡, 如何保證這些信息被合法合理使用, 讓數(shù)據(jù)“可用不可見”[4], 這是亟待解決的問題。同時, 在大數(shù)據(jù)資源的開放性和共享性下, 個人隱私和公民權(quán)益受到嚴重威脅。這一矛盾的存在使數(shù)據(jù)共享程度與數(shù)據(jù)挖掘程度成反比。此外, 經(jīng)過大數(shù)據(jù)技術(shù)的分析、挖掘, 個人隱私更易被發(fā)現(xiàn)和暴露, 從而可能引發(fā)一系列社會問題。
大數(shù)據(jù)背景下的旅游數(shù)據(jù)當然也避免不了數(shù)據(jù)的安全問題。如果游客“吃、住、行、游、娛、購”的數(shù)據(jù)被放入數(shù)據(jù)庫, 被完全共享、挖掘、分析, 那游客的人身財產(chǎn)安全將會受到嚴重影響, 最終降低旅游體驗。所以, 數(shù)據(jù)的安全管理是進行大數(shù)據(jù)挖掘的前提。
3.4 大數(shù)據(jù)人才
大數(shù)據(jù)背景下的智游離不開人才的創(chuàng)新活動及技術(shù)支持, 然而與專業(yè)相銜接的大數(shù)據(jù)人才培養(yǎng)未能及時跟上行業(yè)需求, 加之創(chuàng)新型人才的外流, 以及數(shù)據(jù)統(tǒng)計未來3~5年大數(shù)據(jù)行業(yè)將面臨全球性的人才荒, 國內(nèi)智游的構(gòu)建還缺乏大量人才。
4解決思路
在信息化建設(shè)上, 加大政府投入, 加強基礎(chǔ)設(shè)施建設(shè), 整合結(jié)構(gòu)化數(shù)據(jù), 抓取非結(jié)構(gòu)化數(shù)據(jù), 打通各數(shù)據(jù)壁壘, 建設(shè)旅游大數(shù)據(jù)實驗平臺;在挖掘方法上, 對旅游大數(shù)據(jù)實時性數(shù)據(jù)的挖掘應(yīng)該被放在重要位置;在數(shù)據(jù)安全上, 從加強大數(shù)據(jù)安全立法、監(jiān)管執(zhí)法及強化技術(shù)手段建設(shè)等幾個方面著手, 提升大數(shù)據(jù)環(huán)境下數(shù)據(jù)安全保護水平。加強人才的培養(yǎng)與引進, 加強產(chǎn)學(xué)研合作, 培養(yǎng)智游大數(shù)據(jù)人才。
參考文獻
[1]翁凱.大數(shù)據(jù)在智游中的應(yīng)用研究[J].信息技術(shù), 2015, 24:86-87.
[2]梁昌勇, 馬銀超, 路彩虹.大數(shù)據(jù)挖掘, 智游的核心[J].開發(fā)研究, 2015, 5 (180) :134-139.
[3]張建濤, 王洋, 劉力剛.大數(shù)據(jù)背景下智游應(yīng)用模型體系構(gòu)建[J].企業(yè)經(jīng)濟, 2017, 5 (441) :116-123.
[4]王竹欣, 陳湉.保障大數(shù)據(jù), 從哪里入手?[N].人民郵電究, 2017-11-30.
數(shù)據(jù)挖掘論文14
摘要:主要通過對數(shù)據(jù)挖掘技術(shù)的探討,對職教多年累積的教學(xué)數(shù)據(jù)運用分類、決策樹、關(guān)聯(lián)規(guī)則等技術(shù)進行分析,從分析的結(jié)果中發(fā)現(xiàn)有價值的數(shù)據(jù)模式,科學(xué)合理地實現(xiàn)教學(xué)評估,讓教學(xué)管理者能夠從中發(fā)現(xiàn)教學(xué)活動中存在的主要問題以便及時改進,進而輔助管理者決策做好教學(xué)管理。
關(guān)鍵詞:教學(xué)評估;數(shù)據(jù)挖掘;教學(xué)評估體系;層次分析法
1概述
近年來國家對中等職業(yè)教育的發(fā)展高度重視,在政策扶持與職教工作者的努力下,職業(yè)教育獲得了蓬勃的發(fā)展。如何提高教學(xué)質(zhì)量、培養(yǎng)合格的高技術(shù)人才成為職教工作者研究的課題。各種調(diào)查研究結(jié)果表明:加強師資隊伍的建設(shè),強化教師教學(xué)評估對教學(xué)質(zhì)量的提高尤為重要。
所謂教學(xué)評估,就是運用系統(tǒng)科學(xué)的方法對教學(xué)活動或教育行為的價值、效果作出科學(xué)的判斷過程。教學(xué)評估方式要靈活多樣,要多途徑、多方位、多形式的發(fā)揮評估的導(dǎo)學(xué)作用,以鼓勵評估為主,充分發(fā)揮評估的激勵功能,促進教學(xué)的健康發(fā)展。
在中等職業(yè)學(xué)校多年的教育教學(xué)工作中積累了大量的教務(wù)管理數(shù)據(jù)、教師檔案數(shù)據(jù)等,怎樣從龐雜大量的數(shù)據(jù)中挖掘出有效提高教學(xué)質(zhì)量的關(guān)鍵因素是個難題。數(shù)據(jù)挖掘技術(shù)卻可以從人工智能的角度很好地解決這一課題。通過數(shù)據(jù)挖掘技術(shù),得到隱藏在教學(xué)數(shù)據(jù)背后的有用信息,在一定程度上為教學(xué)部門提供決策支持信息促使更好地開展教學(xué)工作,提高教學(xué)質(zhì)量和教學(xué)管理水平,使之能在功能上更加清晰地認識教師教與學(xué)生學(xué)的關(guān)系及促進教育教學(xué)改革。
2數(shù)據(jù)挖掘技術(shù)
2.1數(shù)據(jù)挖掘的含義
數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。數(shù)據(jù)挖掘應(yīng)該更正確地命名為“從數(shù)據(jù)中挖掘知識”。即數(shù)據(jù)挖掘是對巨大的數(shù)據(jù)集進行尋找和分析的計算機輔助處理過程,在這一過程中顯現(xiàn)先前未曾發(fā)現(xiàn)的模式,然后從這些數(shù)據(jù)中發(fā)掘某些內(nèi)涵信息,包括描述過去和預(yù)測未來趨勢的信息。人工智能領(lǐng)域習慣稱知識發(fā)現(xiàn),而數(shù)據(jù)庫領(lǐng)域習慣將其稱為數(shù)據(jù)挖掘。
2.2數(shù)據(jù)挖掘的基本過程
數(shù)據(jù)挖掘過程包括對問題的理解和提出、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)變換、數(shù)據(jù)挖掘、模式評估、知識表示等過程,以上的過程不是一次完成的,其中某些步驟或者全過程可能要反復(fù)進行。對問題的理解和提出在開始數(shù)據(jù)挖掘之前,最基礎(chǔ)的工作就是理解數(shù)據(jù)和實際的業(yè)務(wù)問題,在這個基礎(chǔ)之上提出問題,對目標作出明確的`定義。
2.3數(shù)據(jù)挖掘常用的算法
2.3.1分類分析方法:是通過分析訓(xùn)練集中的數(shù)據(jù),為每個類別做出準確的描述或建立分析模型或挖掘出分類規(guī)則,以便以后利用這個分類規(guī)則對其它數(shù)據(jù)庫中的記錄進行分類的方法。2.3.2決策樹算法:是一種常用于分類、預(yù)測模型的算法,它通過將大量數(shù)據(jù)有目的的分類,從而找到一些有價值的、潛在的信息。它的主要優(yōu)點是描述簡單,分類速度快,特別適合大規(guī)模的數(shù)據(jù)處理。2.3.3聚類算法:聚類分析處理的數(shù)據(jù)對象的類是未知的。聚類分析就是將對象集合分組為由類似的對象組成的多個簇的過程。在同一個簇內(nèi)的對象之間具有較高的相似度,而不同簇內(nèi)的對象差別較大。2.3.4關(guān)聯(lián)規(guī)則算法:側(cè)重于確定數(shù)據(jù)中不同領(lǐng)域之間的關(guān)系,即尋找給定數(shù)據(jù)集中的有趣聯(lián)系。提取描述數(shù)據(jù)庫中數(shù)據(jù)項之間所存在的潛在關(guān)系的規(guī)則,找出滿足給定支持度和置信度閾值的多個域之間的依賴關(guān)系。
在以上各種算法的研究中,比較有影響的是關(guān)聯(lián)規(guī)則算法。
3教學(xué)評估體系
評價指標體系是教學(xué)評估的基礎(chǔ)和依據(jù),對評估起著導(dǎo)向作用,因此制定一個科學(xué)全面的評價指標體系就成為改革、完善評價的首要目標。評價指標應(yīng)以指導(dǎo)教學(xué)實踐為目的,通過評價使教師明確教學(xué)過程中應(yīng)該肯定的和需要改進的地方;以及給出設(shè)計評價指標的導(dǎo)向問題。
3.1教學(xué)評估體系的構(gòu)建方法
層次分析法(簡稱AHP法)是美國運籌學(xué)家T·L·Saaty教授在20世紀70年代初期提出的一種簡便、靈活而又實用的多準則決策的系統(tǒng)分析方法,其原理是把一個復(fù)雜問題分解、轉(zhuǎn)化為定量分析的方法。它需要建立關(guān)于系統(tǒng)屬性的各因素多級遞階結(jié)構(gòu),然后對每一層次上的因素逐一進行比較,得到判斷矩陣,通過計算判斷矩陣的特征值和特征向量,得到其關(guān)于上一層因素的相對權(quán)重,并可自上而下地用上一層次因素的相對權(quán)重加權(quán)求和,求出各層次因素關(guān)于系統(tǒng)整體屬性(總目標層)的綜合重要度。
3.2構(gòu)建教學(xué)評估指標體系的作用
3.2.1構(gòu)建的教學(xué)評估指標,作為挖掘庫選擇教學(xué)信息屬性的依據(jù)。
3.2.2通過AHP方法,能篩選出用來評價教學(xué)質(zhì)量的相關(guān)重要屬性,從而入選為挖掘庫字段,這樣就減去了挖掘庫中對于挖掘目標來說影響較小的屬性,進而大大減少了挖掘的工作量,提高挖掘效率。3.2.3通過構(gòu)建教學(xué)評估指標,減少了挖掘?qū)ο蟮淖侄,從而避免因挖掘字段過多,導(dǎo)致建立的決策樹過大,出現(xiàn)過度擬合挖掘?qū)ο,進而造成挖掘規(guī)則不具有很好的評價效果的現(xiàn)象。3.2.4提高教學(xué)質(zhì)量評估實施工作的效率。
4數(shù)據(jù)挖掘在教學(xué)評估中的應(yīng)用
4.1學(xué)習效果評價學(xué)習評價是教育工作者的重要職責之一。評價學(xué)生的學(xué)習情況,既對學(xué)生起到信息反饋和激發(fā)學(xué)習動機的作用,又是檢查課程計劃、教學(xué)程序以至教學(xué)目的的手段,也是考查學(xué)生個別差異、便于因材施教的途徑。評價要遵循“評價內(nèi)容要全面、評價方式要多元化、評價次數(shù)要多次化,注重自評與互評的有機結(jié)合”的原則。利用數(shù)據(jù)挖掘工具,對教師業(yè)務(wù)檔案數(shù)據(jù)庫、行為記錄數(shù)據(jù)庫、獎勵處罰數(shù)據(jù)庫等進行分析處理,可以即時得到教師教學(xué)的評價結(jié)果,對教學(xué)過程出現(xiàn)的問題進行及時指正。
另外,這種系統(tǒng)還能夠克服教師主觀評價的不公正、不客觀的弱點,減輕教師的工作量。
4.2課堂教學(xué)評價
課堂教學(xué)評價不僅對教學(xué)起著調(diào)節(jié)、控制、指導(dǎo)和推動作用,而且有很強的導(dǎo)向性,是學(xué)校教學(xué)管理的重要組成部分,是評價教學(xué)工作成績的主要手段。實現(xiàn)對任課教師及教學(xué)組織工作效果做出評價,但是更重要的目的是總結(jié)優(yōu)秀的教學(xué)經(jīng)驗,為教學(xué)質(zhì)量的穩(wěn)定提高制定科學(xué)的規(guī)范。學(xué)校每學(xué)期都要搞課堂教學(xué)評價調(diào)查,積累了大量的數(shù)據(jù)。利用數(shù)據(jù)挖掘技術(shù),從教學(xué)評價數(shù)據(jù)中進行數(shù)據(jù)挖掘,將關(guān)聯(lián)規(guī)則應(yīng)用于教師教學(xué)評估系統(tǒng)中,探討教學(xué)效果的好壞與老師的年齡、職稱、學(xué)歷之間的聯(lián)系;確定教師的教學(xué)內(nèi)容的范圍和深度是否合適,選擇的教學(xué)媒體是否適合所選的教學(xué)內(nèi)容和教學(xué)對象;講解的時間是否恰到好處;教學(xué)策略是否得當?shù)取亩梢约皶r地將挖掘出的規(guī)則信息反饋給教師。管理部門據(jù)此能合理配置班級的上課教師,使學(xué)生能夠較好地保持良好的學(xué)習態(tài)度,從而為教學(xué)部門提供了決策支持信息,促使教學(xué)工作更好地開展。
結(jié)束語
數(shù)據(jù)挖掘作為一種工具,其技術(shù)日趨成熟,在許多領(lǐng)域取得了廣泛的應(yīng)用。在教育領(lǐng)域里,隨著數(shù)據(jù)的不斷累積,把數(shù)據(jù)挖掘技術(shù)應(yīng)用到教學(xué)評價系統(tǒng)中,讓領(lǐng)導(dǎo)者能夠從中發(fā)現(xiàn)教師教學(xué)活動中的主要問題,以便及時改進,進而輔助領(lǐng)導(dǎo)決策做好學(xué)校管理,提高學(xué)校管理能力和水平,同時通過建立有效的教學(xué)激勵機制來達到提高教學(xué)質(zhì)量的目的。這一研究對發(fā)展中的職業(yè)教育教學(xué)管理提出了很好的建議,為教學(xué)管理工作的計算機輔助決策增添了新的內(nèi)容。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于中職教學(xué)評估,設(shè)計開發(fā)一套行之有效的課堂教學(xué)評價系統(tǒng),是下一步要做的工作,必將有力推動職業(yè)教育的快速發(fā)展。
數(shù)據(jù)挖掘論文15
[1]劉瑩.基于數(shù)據(jù)挖掘的商品銷售預(yù)測分析[J].科技通報.20xx(07)
[2]姜曉娟,郭一娜.基于改進聚類的電信客戶流失預(yù)測分析[J].太原理工大學(xué)學(xué)報.20xx(04)
[3]李欣海.隨機森林模型在分類與回歸分析中的應(yīng)用[J].應(yīng)用昆蟲學(xué)報.20xx(04)
[4]朱志勇,徐長梅,劉志兵,胡晨剛.基于貝葉斯網(wǎng)絡(luò)的客戶流失分析研究[J].計算機工程與科學(xué).20xx(03)
[5]翟健宏,李偉,葛瑞海,楊茹.基于聚類與貝葉斯分類器的網(wǎng)絡(luò)節(jié)點分組算法及評價模型[J].電信科學(xué).20xx(02)
[6]王曼,施念,花琳琳,楊永利.成組刪除法和多重填補法對隨機缺失的二分類變量資料處理效果的比較[J].鄭州大學(xué)學(xué)報(醫(yī)學(xué)版).20xx(05)
[7]黃杰晟,曹永鋒.挖掘類改進決策樹[J].現(xiàn)代計算機(專業(yè)版).20xx(01)
[8]李凈,張范,張智江.數(shù)據(jù)挖掘技術(shù)與電信客戶分析[J].信息通信技術(shù).20xx(05)
[9]武曉巖,李康.基因表達數(shù)據(jù)判別分析的隨機森林方法[J].中國衛(wèi)生統(tǒng)計.20xx(06)
[10]張璐.論信息與企業(yè)競爭力[J].現(xiàn)代情報.20xx(01)
[11]楊毅超.基于Web數(shù)據(jù)挖掘的作物商務(wù)平臺分析與研究[D].湖南農(nóng)業(yè)大學(xué)20xx
[12]徐進華.基于灰色系統(tǒng)理論的數(shù)據(jù)挖掘及其模型研究[D].北京交通大學(xué)20xx
[13]俞馳.基于網(wǎng)絡(luò)數(shù)據(jù)挖掘的客戶獲取系統(tǒng)研究[D].西安電子科技大學(xué)20xx
[14]馮軍.數(shù)據(jù)挖掘在自動外呼系統(tǒng)中的應(yīng)用[D].北京郵電大學(xué)20xx
[15]于寶華.基于數(shù)據(jù)挖掘的高考數(shù)據(jù)分析[D].天津大學(xué)20xx
[16]王仁彥.數(shù)據(jù)挖掘與網(wǎng)站運營管理[D].華東師范大學(xué)20xx
[17]彭智軍.數(shù)據(jù)挖掘的若干新方法及其在我國證券市場中應(yīng)用[D].重慶大學(xué)20xx
[18]涂繼亮.基于數(shù)據(jù)挖掘的智能客戶關(guān)系管理系統(tǒng)研究[D].哈爾濱理工大學(xué)20xx
[19]賈治國.數(shù)據(jù)挖掘在高考填報志愿上的'應(yīng)用[D].內(nèi)蒙古大學(xué)20xx
[20]馬飛.基于數(shù)據(jù)挖掘的航運市場預(yù)測系統(tǒng)設(shè)計及研究[D].大連海事大學(xué)20xx
[21]周霞.基于云計算的太陽風大數(shù)據(jù)挖掘分類算法的研究[D].成都理工大學(xué)20xx
[22]阮偉玲.面向生鮮農(nóng)產(chǎn)品溯源的基層數(shù)據(jù)庫建設(shè)[D].成都理工大學(xué)20xx
[23]明慧.復(fù)合材料加工工藝數(shù)據(jù)庫構(gòu)建及數(shù)據(jù)集成[D].大連理工大學(xué)20xx
[24]陳鵬程.齒輪數(shù)控加工工藝數(shù)據(jù)庫開發(fā)與數(shù)據(jù)挖掘研究[D].合肥工業(yè)大學(xué)20xx
[25]岳雪.基于海量數(shù)據(jù)挖掘關(guān)聯(lián)測度工具的設(shè)計[D].西安財經(jīng)學(xué)院20xx
[26]丁翔飛.基于組合變量與重疊區(qū)域的SVM-RFE方法研究[D].大連理工大學(xué)20xx
[27]劉士佳.基于MapReduce框架的頻繁項集挖掘算法研究[D].哈爾濱理工大學(xué)20xx
[28]張曉東.全序模塊模式下范式分解問題研究[D].哈爾濱理工大學(xué)20xx
[29]尚丹丹.基于虛擬機的Hadoop分布式聚類挖掘方法研究與應(yīng)用[D].哈爾濱理工大學(xué)20xx
[30]王化楠.一種新的混合遺傳的基因聚類方法[D].大連理工大學(xué)20xx
[31]楊毅超.基于Web數(shù)據(jù)挖掘的作物商務(wù)平臺分析與研究[D].湖南農(nóng)業(yè)大學(xué)20xx
[32]徐進華.基于灰色系統(tǒng)理論的數(shù)據(jù)挖掘及其模型研究[D].北京交通大學(xué)20xx
[33]俞馳.基于網(wǎng)絡(luò)數(shù)據(jù)挖掘的客戶獲取系統(tǒng)研究[D].西安電子科技大學(xué)20xx
[34]馮軍.數(shù)據(jù)挖掘在自動外呼系統(tǒng)中的應(yīng)用[D].北京郵電大學(xué)20xx
[35]于寶華.基于數(shù)據(jù)挖掘的高考數(shù)據(jù)分析[D].天津大學(xué)20xx
[36]王仁彥.數(shù)據(jù)挖掘與網(wǎng)站運營管理[D].華東師范大學(xué)20xx
[37]彭智軍.數(shù)據(jù)挖掘的若干新方法及其在我國證券市場中應(yīng)用[D].重慶大學(xué)20xx
[38]涂繼亮.基于數(shù)據(jù)挖掘的智能客戶關(guān)系管理系統(tǒng)研究[D].哈爾濱理工大學(xué)20xx
[39]賈治國.數(shù)據(jù)挖掘在高考填報志愿上的應(yīng)用[D].內(nèi)蒙古大學(xué)20xx
[ 40]馬飛.基于數(shù)據(jù)挖掘的航運市場預(yù)測系統(tǒng)設(shè)計及研究[D].大連海事大學(xué)20xx
【數(shù)據(jù)挖掘論文】相關(guān)文章:
數(shù)據(jù)挖掘論文07-15
旅游管理下數(shù)據(jù)挖掘運用論文(6篇)11-18
旅游管理下數(shù)據(jù)挖掘運用論文(集合6篇)11-18
旅游管理下數(shù)據(jù)挖掘運用論文(匯編6篇)11-18
數(shù)據(jù)挖掘工程師的職責內(nèi)容02-23
數(shù)據(jù)挖掘工程師崗位職責06-04