bt 另类 专区 欧美 制服-brazzers欧美精品-blz在线成人免费视频-blacked黑人战小美女-亚洲欧美另类日本-亚洲欧美另类国产

統計學路徑分析范例6篇

前言:中文期刊網精心挑選了統計學路徑分析范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

統計學路徑分析范文1

〔論文關鍵詞〕中學生;同伴支持;類型;學習成績 

 

與小學相比,中學生與同伴共度的時間顯著增加,同伴關系的重要性也隨之上升。同伴關系在中學生的發展中具有成人無法替代的獨特作用,其影響甚至超過了父母。同伴關系的好壞直接或者間接地影響著中學生的學習成績。有研究表明,不受歡迎的兒童學習成績普遍低于受歡迎的兒童,并且其缺勤率和中途輟學率也很高(楊光艷,陳清萍,2006)。同伴支持作為同伴關系的一種特殊形式對中學生的學習成績有著極其重要的作用。這里的同伴支持主要是指中學中同齡人之間或者心理發展水平相當的個體之間在交往過程中建立和發展起來的一種支持關系。它以情感、信息和工具支持等直接或間接地對中學生的學習成績產生作用。 

 

一、中學生同伴支持的類型 

 

根據同伴的類型以及提供支持的形式,可以將中學生同伴支持大致分為四類:自由支持、網絡支持、同伴服務以及同伴雇傭。這些類型的同伴支持直接或者間接地影響著中學生的學習成績。 

1.自由支持 

這類同伴支持主要表現在中學生的日常學習生活中,當面臨困難時,個體主動地或不由自主地向同伴尋求幫助和支持,或者個體積極主動地向需要幫助的同伴提供援助。這種支持往往建立在友誼或同學友好關系的基礎之上,更多的在于關注成長、自我需要和人格發展等,是出于自愿的,常常以一對一的自由支持形式表現出來。 

2.網絡支持 

隨著網絡的普及,中學生常常通過網絡方式,如電子郵件或信息交流平臺等向同齡人傳遞信息,尋求或者提供支持,這類支持更多地表現為情感和信息支持。這種方式具有匿名性,這一點受到學生的歡迎,但這種方式不利于建立穩固的支持關系。 

3.同伴服務 

這類同伴支持是由具有相同的心理知識水平,并且面臨共同問題的中學生組成的支持小組,如具有相同學習困難的個體聚在一起相互交流、相互支持。他們具有相同的話題,共同探討,共同尋求發展。 

4.同伴雇傭 

在學校中,教師常常指定一部分學生充當其他學生的同伴,以幫助他們提高。如安排學習成績好的或者相對較好的學生幫助學習成績較差者以提高他們的成績。這部分“被充當”同伴的學生往往具有較高的“地位”,并接受教師的指導和安排。這些學生被指定為同伴的角色,類似于雇傭充當同伴。 

 

二、同伴支持直接影響中學生的學習成績 

 

直觀上來看,中學生的學習成績直接受到學生知識儲備、學習技能和學習方法等的影響。同伴支持也主要是通過影響這三個方面來直接對中學生的學習成績產生作用。在學習過程中,同伴之間相互關心,互相傳遞學習信息,交流學習經驗,直接地給予學習上的支持和幫助。這種支持關系可能是自由形成的,也可能是教師指導安排的。 

在眾多的支持形式中,同伴輔導對學習成績的直接作用最明顯。這里的同伴輔導主要是指同伴之間開展的學習上的輔導。在學習過程中,同伴輔導作為同伴支持關系的一個系統,包含了學生互助學習和通過輔導來自我學習(topping,1996)。根據moust and schmidt(1994)的研究,同伴輔導中,同伴“輔導員”的作用超越了教師,他們比教師更好地理解學生的學習問題,因為他們具有相似的學習經歷。同伴輔導可以使被輔導者的學習更加有效,同時也有利于自身的學習提高(jones,1995),因為同伴支持具有交互性,在給予他人支持的同時,個體也得到他人的支持而從中獲益。同伴輔導通過同伴之間的學習經驗交流、方法探討以及技能培訓等方式拓寬各自的學習方式和思維,使學生們更加系統地多角度地思考問題,提高問題解決的能力,從而更加深入地學習,提高學習成績。 

此外,同伴支持具有認知發展功能,良好的同伴支持可以使個體的“最近發展區”得到開發(周宗奎,2007)。中學生在同伴的支持和輔導下其學習水平將會大大地提高,這必然會使個體的學習成績得以提升。 

 

三、同伴支持通過調節作用間接對中學生學習成績產生影響 

 

中學生的學習成績不僅受到智力因素的影響,同時也受到非智力因素的影響。同伴支持能夠通過調節中學生的非智力因素,如自我效能感、自尊、學習動機、情緒等間接地對其學習成績產生影響。 

1.同伴支持通過自我效能感影響學習成績 

研究表明,同伴支持通過四個方面改變個體的自我效能感,即個體先前的成就表現、替代性經驗、言語說服以及心理狀態(cindy,2003)。中學生來自同伴的支持也是通過這四個方面對自我效能感發生作用:(1)中學生先前的成績表現是自我效能感最有力的資源,而這些表現會受到同伴評價的影響,來自同伴的積極評價會增強個體的自我效能感。(2)在學習過程中,通過觀察同伴的榜樣行為來獲得間接經驗。當個體看到與自己水平相似的同伴在學習上取得成功時,就會增強自我效能感,認為自己也可以成功。(3)在中學生的學習過程中,同伴常常以建議和勸說來對個體加以引導,以在學習上取得進步,這種勸說通常由具有影響力(如學習成績好)的同伴來實施。勸說的根據越可信,就越能影響個體的自我效能感。(4)在學習生活中,中學生的學習效能感會受到當時的心理情緒狀態的影響,積極的心理狀態會增強自我效能感,而消極的心理狀態則會降低效能感。來自同伴的情感支持可以使個體保持良好的心理狀態,減少個體的消極情緒,從而改變效能信念。 

許多研究都已經表明,自我效能感與學習成績之間的關系十分密切(coutinho s,2008; friedel et al,2007),且自我效能感對學習成績有直接的影響作用(magogwe and oliver,2007)。培養良好的自我效能感有助于學習成績的提高。同伴支持可以調節自我效能感,而自我效能感又與學習成績有密切聯系,因而同伴支持可以通過改變中學生的自我效能感來間接地對學習成績產生作用。 

2.同伴支持通過自尊影響學習成績 

中學階段是個體自尊的快速發展階段。自尊對中學生的發展有著極其重要的作用,它不僅影響其人格的發展,而且對其學習成績也有重要作用。不少研究已經發現,學生的學業成績與自尊之間存在著密切關系。shavelson和bolus(1982)的研究甚至證明了學生的自尊和學習成績之間存在著因果決定關系。covington(1989)研究發現,自尊水平增強或者降低時,學業成績會隨之發生相應的變化,據此他認為自尊的改變會引起學業成績的起伏。自尊除了直接影響中學生的學習成績外,還可以通過影響學習倦怠、學習適應、學習動機等間接對學習成績發生作用。 

同伴關系的研究表明,同伴關系直接對青少年自尊產生重要影響(張麗華,2009),那些與同伴關系密切、同伴接受性高或對同伴關系較為滿意的個體往往具有較高水平的自尊,良好的同伴關系有利于自尊的發展。社會支持的研究也指出,來自朋友的肯定和支持與青少年的學業自尊有較高的相關(劉春梅,鄒泓,2007)。同伴支持建立在良好的同伴接納的基礎之上,由此我們可以推論,良好的同伴支持必然對中學生的自尊產生影響。另外,同伴支持環境可以給中學生帶來安全感和歸屬感,而安全感和歸屬感作為自尊形成的要素必然對其產生重要的影響。中學生的自尊具有不穩定性,同伴支持可以調整個體的自尊水平,使其保持在一個穩定的狀態。同伴支持正是通過調整中學生的自尊水平來對學習成績產生影響。 

3.同伴支持通過學習動機影響學習成績 

學習動機直接影響中學生的學習成績,這已經是毋庸置疑的了。同伴支持除了直接影響學習成績外,還可以通過學習動機間接影響學習成績。社會支持的研究已經證明了這一點(石學云,2005)。 

cindy(2003)指出,良好的同伴支持能夠促進積極的個人動機。kathryn et al.(2010)的研究表明,在一些學校中同伴支持以積極的方式影響學生的學業動機。當學生感知到同伴向自己提供學業期望、幫助、建議和情感支持并為自己創造一個安全的學習環境時,更傾向于展示學習的積極方面。同伴支持對學習動機的影響主要表現為: 

(1)學生的個人價值觀是影響學習動機的重要因素。同伴之間相互交流對于學習成績的價值觀和期望將會對個體的價值觀產生影響,同時也會影響個體的學習興趣,從而影響學習動機。(2)同伴為發展個體的學業能力(競爭力)提供幫助。中學生同伴之間會經常相互澄清和解釋關于教師的指導,如他們應該做什么以及他們應該如何做。同時,同伴也以榜樣或相互比較的形式向個體傳遞信息,提高個體競爭力。(3)同伴支持環境為學生提供了一個安全的學習環境,在這樣的環境中個體可以輕松、愉快地進行學習。良好的學習環境對學習動機的激發和培養具有重要的作用。另外,中學生具有較強的親和內驅力,希望獲得他人的關心、愛護和支持,希望在同伴中獲得一定的地位,得到同伴的尊重。而良好的學習成績是滿足學生這一需要的最好方式。 

4.同伴支持通過情緒影響學習成績 

積極而穩定的情緒對中學生的學習具有促進作用,可以使個體更好地適應學習,保持良好的學習狀態,同時還可以激發和維持個體的學習動機,使個體更加專心于學習;而消極不穩定的情緒會使學生煩躁不安,思維混亂,注意力不集中,這將嚴重干擾學習。 

同伴支持具有情緒功能。同伴關系對青少年情緒的發展非常重要,當個體進入青春期時,他們越來越依靠其同伴以獲得情感支持,特別是在遇到麻煩或困惑時。而青少年的情緒極不穩定,常常受到消極情緒的影響。他們應對消極情緒的能力取決于他們能否與同伴建立起新型的支持關系。同伴的關心、愛護和鼓勵可以幫助個體走出消極情緒的陰霾,且良好的同伴支持環境可以使個體長期保持良好的情緒狀態。同伴支持可以通過其情緒功能間接對中學生的學習成績產生影響。 

 

四、中學生同伴支持的反向作用 

 

通常意義上所說的同伴支持是指積極的同伴支持,它積極影響個體的行為結果。事實上同伴支持也存在消極的一面,對個體的發展具有一定的反向作用。 

1.錯誤認知的誤導 

在中學生的學習過程中,盡管同伴之間相互支持和幫助,但不同的個體具有不同的認知和價值觀念,而這些認知或觀念不一定都是正確的。同伴的錯誤認知或觀念可能會在學習過程中誤導個體,盡管支持者并不是有意的。另外,也存在這樣的支持群體,這種群體中的成員都持有錯誤的觀念和認知,但他們共同以一種錯誤的認知來相互支持和引導對方,進而將整個群體成員引入歧途。如群體中成員都認為學習成績無用,并且相互認同這種觀點,就很可能導致整個群體出現厭學狀態。因而在學習生活中,教師應該充分發揮其指導作用,樹立學生正確的認知觀念,并且盡量使支持雙方在認知和行為上做到匹配,從而使學生在同伴支持過程中以正確的方式相互引導和支持。 

2.過度依賴 

統計學路徑分析范文2

【關鍵詞】 生存質量;大學生;人格特征;網絡成癮;路徑分析

doi:10.3969/j.issn.1000-6729.2009.02.014

中圖分類號:C913.5,R749.91 文獻標識碼:A 文章編號:1000-6729(2009)002-0138-05

生存質量又稱生命質量、生活質量(Quality of Life,QOL),是指個體生理、心理、社會功能以及物質生活條件各方面的客觀狀態和主觀感受[1-2]。大學生是網絡使用的高頻率人群,也是網絡成癮(亦稱網絡過度使用)的高發人群之一[3-4]。國內外研究表明,網絡過度使用對大學生的身心健康有嚴重的影響[3-5],但很少有研究評估網絡過度使用大學生的生存質量狀況。研究還表明,人格特征對大學生過度使用網絡存在影響[4,6-7],但人格特征、網絡使用程度與生存質量之間的關系尚不清楚。本研究采用路徑分析探討不同網絡使用程度大學生人格特征與生存質量的關系,為改善和提高大學生的生存質量提供依據。

1 對象與方法

1.1對象

2006年11月方便選取湖南省長沙市某綜合性大學。該大學共有在校本科生近20000人,覆蓋理科、工科和文科57個專業4個年級。其中理科學生7500人,工科學生9000人,文科學生3500人。一年級學生約5500人,二、三年級學生各5000人左右,四年級學生約4500人。采用分層整群抽樣方法,先按專業(理科、工科和文科)分層,然后按年級(一、二、三、四年級)分層,用隨機數字表法從每一層抽取3~4個班(要求每一層學生人數在100人左右)。共計抽樣32個班1350人,其中44人因問卷缺省條目超過5%,予以剔除,最終獲得有效問卷1306份。受試學生平均年齡為(19.5±2.1)歲,男女生比例分別為56.3%和43.7%。

1.2工具

1.2.1 一般情況調查表

該表包括①社會人口學指標(年齡,性別,是否獨生子女,生源地,所在年級,所學專業);②家庭情況(父母親年齡,職業,受教育程度,家庭人均月收入);③人際關系(對父母親關系的評價,與同學、老師相處情況,對學校生活的適應情況,對所學專業的滿意度);④網絡使用情況[上網時間,上網的目的,每月上網費用(元),對網絡使用的態度]。

1.2.2 網絡成癮診斷量表 (Internet Addiction Test,IAT)[8]

該量表為自評量表,由20個條目組成,每個條目有5種選擇,賦值1~5分,總分為100分。根據總分判定測試者是否網絡成癮及其程度,總分49分及以下為正常使用網絡,50~79分判定為網絡成癮傾向,80~100分判定為網絡成癮。該量表目前國內使用較多,未見信度、效度指標報告。本研究中,該量表的內部一致性系數α達到0.9234,各條目間的相關系數在0.35~0.87之間,均有統計學意義。

1.2.3 艾森克人格問卷(Eysenck Personality Questionnaire, EPQ)(成人版)[9]

該問卷共有85個條目,包括四個分量表三個維度:P量表測量精神質維度、E量表測量內外傾維度、N量表測量神經質維度、L量表測量受試者的“掩飾”傾向和純樸性。每個條目分“是”與“否”兩種選擇,其中一部分條目答“是”記“1”分,答“否”記“0”分,另一部分條目記分方式則相反,分別統計各分量表原始總分,再將各分量表原始總分換算成標準分。經驗證該量表的信度和效度較好,各分量表間隔 1個月重測,其相關系數為0.83~0.90,內部一致性系數為0.68~0.81[9]。

1.2.4世界衛生組織生存質量量表簡表中文版(World Health Organization Quality of Life Brief Scale,WHOQOL-BREF)[10]該量表由26個條目組成,包括總的生存質量和總的健康狀況(共2個條目)及生理領域、心理領域、社會關系領域、環境領域4個維度(共24個條目),每個條目分別按1~5級計分,得分越高,說明生存質量越好。該量表已被證實具有較好的信度和效度[10]。考慮到量表的第21條“您對自己的性生活滿意嗎?”不適合大學生,胡國清等[11]采用相同量表對高中生調查時將該條目改為“您對自己青春期的變化適應嗎?”,考慮到大學生與高中生具有相似之處,本次調查也將該條目作相同替換處理。

將被調查的學生集中在教室,由經過培訓的調查人員講解問卷的正確填寫方法后,要求學生在30~40分鐘時間內獨立完成,所有問卷填寫后當場收回。在調查結束后第14天隨機抽取1 個班的學生(共30人)進行重復測量,將兩次調查結果進行一致性分析。

1.3統計方法

經調查人員核實評分后,用Epi Data3.0建立數據庫,采用雙錄入檢錯。采用SPSS13.0軟件進行描述性分析和方差分析(F檢驗),對方差分析有統計學差異者再用最小極差法(LSD)作兩兩比較。另外,采用結構方程模型分析軟件Amos (Analysis of Moment Structures)7.0作路徑分析。

2結果

2.1大學生網絡成癮情況

網絡成癮診斷量表評分結果顯示,1306名大學生中有1129名大學生屬于正常使用網絡(占86.45%),有169人屬于網絡成癮傾向(占12.94%),有8人屬于網絡成癮(占0.61%)。

2.2 不同網絡使用程度大學生艾森克人格問卷、生存質量量表評分比較

方差分析結果顯示,三組學生的神經質、精神質和掩飾維度得分差異有統計學意義。進一步兩兩比較顯示,正常網絡使用組學生的神經質、精神質維度得分低于網絡成癮傾向組和網絡成癮組學生,而掩飾維度得分高于網絡成癮傾向組和網絡成癮組學生;三組學生在生存質量的生理、心理和社會關系領域得分差異有統計學意義;經兩兩比較,正常使用網絡組學生生理、心理和社會關系領域得分均高于網絡成癮傾向組和網絡成癮組學生(見表1)。

2.3 人格特征對網絡使用大學生生存質量影響的路徑分析

該分析以艾森克人格問卷的內外傾、神經質、精神質、掩飾性得分為外生顯變量,以網絡成癮診斷量表總分、生存質量量表的生理、心理、社會關系和環境領域得分為內生顯變量,建立路徑分析模型。模型通過最大似然法(Maximum Likelihood Estimates, ML)不斷擬合,最終得到擬合較好的路徑分析修正模型[ χ2=5.595,df=6,P=0.428;GFI(擬合優度指數)=0.993,AGFI(調整擬合優度指數)=0.982;RMSEA(近似誤差均方根)=0.035](圖1)。內外傾對生存質量的4 個領域均有直接正向效應,神經質、精神質對生存質量的4 個領域均有直接負向效應,神經質、精神質對網絡成癮分有直接正向效應,掩飾性對網絡成癮分有直接負向效應,神經質、精神質、掩飾性還可通過影響網絡成癮分間接影響生存質量的3個領域(環境領域除外);網絡成癮分對生存質量的3個領域(環境領域除外)有直接負向效應。

艾森克人格問卷 4個分量表得分高低對網絡成癮分及生存質量4 個領域的影響效應大小(包括總效應、直接效應和間接效應)見表2 。

3 討論

本研究結果表明,大學生網絡成癮傾向及網絡成癮的比率為13.55%。曾瑾等[12]采用相同量表報告成都市大學生網絡成癮比率(網絡成癮傾向+網絡成癮)為5.8%,中學生網絡成癮比率(網絡成癮傾向+網絡成癮)為20.3%,提示大學生網絡成癮率存在時間、地點、人群差異。本研究單因素分析顯示,網絡成癮傾向大學生與網絡成癮大學生生存質量的3個領域(環境領域除外)得分均低于正常使用網絡大學生,提示網絡成癮傾向大學生及網絡成癮大學生有較低的生存質量,與Ferraro 等[13]的研究基本一致。網絡成癮傾向大學生及網絡成癮大學生有較低的掩飾性得分以及較高的神經質得分和精神質得分,與金宇等[14]、CAO等[15]對青少年的研究結論基本一致,國外學者的研究[6-7]也支持這一結論。提示網絡成癮傾向大學生及網絡成癮大學生在人格特征方面與正常使用網絡大學生存在差異。

根據艾森克人格理論,神經質維度得分高的人容易焦慮、擔憂, 常郁郁不樂, 憂心忡忡, 有強烈的情緒反應;精神質維度得分高的人具有性格孤僻, 對他人漠不關心, 不近人情, 與人不友好的特點, 具備這些人格特征基礎的人群正性情感體驗都較低,容易在虛幻的世界中尋求自我,因而也易于沉溺于網絡之中[16-17]。 Kim 等[6]研究沉溺于在線網絡游戲青年的人格特征,表明具有攻擊和自戀性人格特征及自我控制力低的青年容易沉溺于在線網絡游戲。Neimz 等[18]的研究表明,沉溺于互聯網的學生容易出現社會、人際關系方面的問題,具有較低的自尊和較強的社交性去抑制(sociallydisinhabited)。張翠紅等[4]用SCL-90量表比較正常使用網絡大學生與網絡成癮大學生的心理健康狀況,也顯示網絡成癮傾向大學生有較多的心理問題。可見,神經質、精神質維度分高的學生有較低的生存質量,也易于沉溺于網絡,進一步降低其生存質量。研究還顯示,內外傾維度分高的學生有較高的生存質量,可能與內外傾分高的人具有外向性格、愛交際、朋友多的特點,能獲得較多的社會支持并有較多的正性情感體驗有關[19]。

本研究通過橫斷面研究發現人格特征對網絡使用程度不同大學生的生存質量可能具有直接和間接的影響。但為了建立人格特征與網絡使用程度不同大學生生存質量之間的因果關系,需要進一步采用隊列研究方法,同時將其他可能相關的因素如個人因素(性別、年齡、學習成績)、家庭情況(經濟狀況、教養方式)、學校因素(人文環境)等結合起來進行研究。

參考文獻

[1]Orley J, Kuyken W. Quality of life assessment:International Perspectives[M]. Springer Verlag, Berlin,1994:36-37.

[2]WHO. The development of the WHO quality of life assessment instrument[M].Geneva.1993.

[3]朱克京, 吳漢榮.大學生網絡成癮的心理社會因素[J].中國心理衛生雜志, 2004, 18 (11):796-798.

[4]張翠紅,劉國偉,謝正,等.大學生網絡成癮與人格特征及心理健康狀況分析[J].中國心理衛生雜志,2006,20(11):761.

[5]Ozcan NK, Buzlu S. Internet use and its relation with the psychosocial situation for a sample of university students[J].Cyberpsychol Behav, 2007,10(6):767-72.

[6]Kim EJ, Namkoong K, Ku T, et al.The relationship between online game addiction and aggression, self-control and narcissistic personality traits[J]. Eur Psychiatry, 2008 ,23(3):212-8.

[7]Ko CH, Yen JY, Chen CC, et al. Tridimensional personality of adolescents with internet addiction and substance use experience[J]. Can J Psychiatry, 2006,51(14):887-94.

[8]師建國. 成癮醫學(第1 版) [M]. 北京:科學出版社, 2003,205-206.

[9]陳仲庚. 艾森克人格問卷的項目分析[J]. 心理學報,1983,15(2):211-218.

[10]方積乾.生存質量測定方法及應用[M].北京:北京醫科大學出版社,2000,1:118-122.

[11]胡國清,孫振球,黃正南,等.高中生生存質量評定量表的研制與考評[J].中國衛生統計,2002,19(2):71-75.

[12]曾瑾, 陳希寧. 成都市大、中學生網絡成癮行為的比較研究[J]. 現代預防醫學,2006,33(10):1790-1791.

[13]Ferraro G,Caci B,D'Amico A,et al.Internet addiction disorder:An Italian study[J]. Cyberpsychol Behav, 2007,10(2):170-175.

[14]金宇,蘇林雁,曹楓林,等.網絡過度使用傾向中學生的人格特征[J].中國心理衛生雜志,2007,21(12):832-836.

[15]Cao F, Su L. Internet addiction among Chinese adolescents:prevalence and psychological features[J]. Child Care Health Dev, 2007,33(3):275-81.

[16]鄭日昌. 大學生心理診斷[M]. 濟南:山東教育出版社.第1 版.1996:186-189.

[17]唐潔, 孟憲璋. 大中學生主觀幸福感的比較研究[J].中國臨床心理學雜志, 2002, (4) :316-320.

[18]Niemz K, Griffiths M, Banyard P. Prevalence of pathological Internet use among university students and correlations with self-esteem, the General Health Questionnaire (GHQ), and disinhibition[J]. Cyberpsychol Behav,2005, 8(6):562-570.

統計學路徑分析范文3

【關鍵詞】醫學生;社會責任心;人格;自我意識

1對象與方法

1.1研究對象

采用問卷法對某醫學院學生進行調查,發放問卷1550份,回收有效問卷1497份。對問卷信息進行整理合并,結果如下:男548人、女949人;年齡16-25歲,平均19.89±1.36歲;大一447人、大二491人、大三385人、大四174人;臨床醫學546人、醫學護理430人、醫學社會學521人;戶籍地城市542人、鄉鎮955人;健康狀況為疾病或較差203人、良好689人、健康605人;家庭結構為大家庭341人、核心1071人、單親71人、其它14人;家庭人均收入1000元以下335人、1000-2999元708人、3000-4999元268人、5000元以上186人;父母最高教育小學(或以下)226人、初中743人、高中(中專)355人、大學(或以上)173人;獨生子女592人、非獨生子女905人。

1.2研究方法

1.2.1一般情況調查表收集年級、專業、性別、年齡、同胞數、戶籍地、健康狀況、家庭結構、家庭經濟、父母教育、學生干部、參加社團、參加公益等資料。1.2.2大學生社會責任心問卷該問卷由趙興奎[4]編制,共36個條目,分物質責任心(12條)、文化責任心(10條)和群體責任心(14條)等三個維度。采用1-5五級評分,分數越高,反映其社會責任心越強。1.2.3中國大五人格問卷簡式版該問卷由王孟成等編制[10],共40個條目,分神經質、外向性、嚴謹性、開放性和宜人性等五個維度。每個條目采用1-6六級評分,分數高低代表某種維度傾向性高低。1.2.4自我意識量表該問卷由蔣燦等人修訂[11],含23個條目,分公我意識、私我意識和社會焦慮等三個維度。每個條目采用0-4五級評分,得分越高自我意識水平越高。

1.3統計分析

采用SPSS18.0統計軟件和AMOS21.0軟件對數據進行分析,包括χ2檢驗、F檢驗、t檢驗、多元逐步回歸分析和路徑分析。

2結果

2.1醫學院校學生社會責任心水平

與測驗編制者趙興奎的數據相比,醫學院校學生社會責任心總分沒有統計學差異(P0.05),物質責任心和群體責任心相對較高、文化責任心相對較低(P0.01);與冉匯真一般本科院校學生數據相比,醫學院校學生社會責任心總分和三個維度分均高于普通高校學生(P0.01)。

2.2醫學院校不同專業學生社會責任心差異分析

方差分析結果顯示:醫學院校不同專業學生社會責任心存在差異(P0.01);兩兩比較(LSD檢驗)顯示:醫學護理專業責任心相對較低、醫學社會學專業相對較高、臨床醫學專業居中,組間差異具有統計學意義(P0.05)。

2.3社會責任心影響因素的逐步回歸分析

以社會責任心總分為因變量,社會人口學資料和心理學指標為自變量,進行逐步回歸分析(進入水準α=0.05,剔除水準β=0.10),結果顯示(表3):專業(1=醫學護理,2=臨床醫學,3=醫學社會學)、性別(1=男,2=女)、家庭經濟(1=1000元以下/人,2=1000-3000元,3=3000-5000元,4=5000元以上)、健康狀況(1=較差,2=一般,3=較好)、宜人性(測量值)、開放性(測量值)、嚴謹性(測量值)、外向性(測量值)、自我意識(測量值)等9個變量進入回歸方程,可解釋社會責任心總分49.5%的變異。

2.4心理社會因素影響社會責任心的路徑分析

回歸分析發現的影響因素可歸為三類:社會人口學變量(性別、專業、家庭經濟、健康狀況)、人格變量(宜人性、開放性、嚴謹性、外向性)和自我意識(私我意識、公我意識、社交焦慮)。采用結構方程分析這三類變量影響社會責任心的路徑,結果顯示:模型擬合指標(CMIN/DF=4.45,RMSEA=0.05,GFI=0.98,AGFI=0.96,NFI=0.96,RFI=0.94,IFI=0.97,TLI=0.95,CFI=0.97,PGFI=0.59,PNFI=0.68,PCFI=0.69)基本達到模型適配標準,能共同解釋社會責任心57.2%的變異;人格直接影響社會責任心(效應值=0.76),自我意識(效應值=0.36)和社會人口學變量(效應值=0.45)均經人格間接影響社會責任心。圖1心理社會因素影響社會責任心的路徑分析

3討論

目前國內關于大學生責任心方面的理論研究多于實證研究,在有限的實證研究中,研究對象多為綜合性大學學生,針對醫學院校學生責任感的研究極少。本研究對醫學院校學生的社會責任心狀況及影響因素做了調查,現就有關研究結果做簡要分析討論。

3.1醫學院校學生社會責任心狀況

首先,醫學院校學生社會責任心與趙興奎[4]的大學生常模數據相比,總體水平沒有明顯差異,物質責任心和群體責任心相對較高、文化責任心相對較低;與冉匯真[5]一般本科院校學生相比,醫學院校學生社會責任心相對較高。其次,醫學院校不同專業學生社會責任心存在差異,即醫學社會學專業社會責任心相對較高、臨床醫學專業居中、醫學護理專業相對較低,以往研究也發現不同專業大學生責任心存在差異,如藝體類和經貿類大學生社會責任心相對較低,文科類學生相對較高[3-5]。這些結果表明醫學院校學生同其它大學生一樣具有較強的社會責任感、集體意識、職責和義務的責任意識,更加關注人類基本生存環境和生命價值;任何群體的社會責任感都受多種因素的影響,使不同群體責任感各具特色,臨床醫學和護理專業學生將肩負救死扶傷的職責,他們把更多的精力投入專業學習中,更加關注能力和技術的發展。

統計學路徑分析范文4

關鍵詞:PLS路徑模型;綜合評價;審視

一、 引言

PLS路徑模型(PLSPM)是指基于偏最小二乘方法的結構方程模型,該方法最初提出是為了克服基于協方差分析結構方程模型(CB-SEM)很強的分布假定(R?nkk?. M and Evermann. J,2013)。在實際應用中,該方法在綜合評價中也有不少應用,特別是在滿意度綜合評價方面應用廣泛,在商學、管理學等社會科學中有重要地位。以致部分文獻將顧客滿意度模型等同于PLS路徑模型(梁燕和金勇進 2007)。近年來,我國學術界對于該方法的應用在綜合評價的研究也如雨后春筍一般出現了不少文獻(如:王惠文和付凌暉,2004;林盛,劉金蘭和韓文秀,2005;阮敬和紀宏,2006;鄒樹梁等,2008;劉旭華,2008;莫一魁和沈旅歐,2009;關子明等2009;葉明和張磊,2010;鮮思東和彭作祥,2011;區晶瑩等,2011;楊威和張拓紅,2012;王慶豐,2013)。根據這些文獻和綜合評價理論,可以將PLS路徑模型進行綜合評價的步驟歸納為:第一,確定評價目標,建立指標體系,收集數據;第二,實施綜合評價,具體為:①用迭代(包括一系列最小二乘回歸,線性運算和抽取平方根)得到潛變量的表達式,它們是可測變量的加權平均;②用通常的最小二乘得到潛變量之間的線性關系;③用通常的最小二乘得到潛變量與對應可測變量間的線性關系;④利用潛變量的估計值得到各種指數,進行綜合評價。第三,檢驗與評估綜合評價的結果。筆者查閱了近年來的相關文獻發現,多數文獻指出PLS路徑模型進行綜合評價有著其他方法沒有的優勢,具體可以歸納為四點:第一,克服多重相關性和共線性的影響;第二,相比CB-SEM,分布假定很弱;第三,樣本容量要求沒有CB-SEM高,適合小樣本情形;第四,是一種客觀的綜合評價方法。但是,目前沒有文獻在綜合評價框架下對這些優點做出進一步的細致說明。筆者認為,PLS路徑模型并非為綜合評價專門設計的方法,并且這些優點基本上是相對CB-SEM比較得出的,將它們直接移植到綜合評價領域,不甚嚴格,需要推敲。事實上,用于綜合評價的統計模型很多,但是很多學者對這些模型在綜合評價框架下的適用性進行了研究,例如,僅關于主成分分析就有很多文獻,如蘇為華(2000),王學民(2007),林海明和杜子芳(2013)等。為此,本文將對上述四大優點在綜合評價框架下進行審視,提出并解答四個問題,即利用PLS路徑模型進行綜合評價時:

(1)有沒有樣本量的要求?

(2)有沒有針對樣本的分布假定要求?

(3)沒有多重共線性的影響了嗎?

(4)客觀性體現在哪里?

二、 問題的研究

為了對上述問題進行研究,我們首先概述PLS路徑模型的算法,然后根據概述回答問題。

1. PLS路徑模型算法概述。利用PLS路徑分析進行綜合評價,首先要分劃好可測變量的歸屬,一個潛變量對應一組可測變量。為此假設有Q個潛變量?孜1,…,?孜Q,第j個潛變量對應的可測變量為Xj=(xj1,…,xjpj)′,j=1,…,Q。則有xjh=?姿jh?孜1+?著jh(h=1,2,…,pj)或者?孜j=?撞■■wjh+?著j,前者為反映型(Reflective),系數為載荷;后者為反映型(Formative),系數為權重,選擇何種形式需要根據實際問題決定,這種反映可測變量與潛變量關系的模型為測量模型。其次要設定好潛變量與潛變量之間的關系結構,即?孜i=?撞■■?茁ij?孜j+vij。這部分模型稱為結構模型,模型中的系數為路徑系數。潛變量的得分(即潛變量的估計值)是進行綜合評價的關鍵,對其估計通過迭代實現。由三大步驟組成:

外部逼近:

Yj∝■wjhxjh

Yj是?孜j的外部逼近估計量,∝表示左邊是右邊的標準化,Wj=(wj1,…,wjpj)′是外部權重。

內部逼近:

zj∝■ejiYi

其中,i:i?圮j表示與第j個潛變量直接有關的潛變量的下標。eji是內部權重,有三種不同的形式(Tenenhaus M,2005)。

更新權重:

內部權重由潛變量間的結構決定,迭代過程中需要更新的是外部權重,當測量模型為反映型時,對于xjh,其新權重為以Zj為自變量,xjh為因變量的一元線性回歸系數,但由于Zj被標準化,因此有wjh=cov(xjh,Zj),當測量模型為構成型時,新的權重以Zj為因變量,與之對應的可測變量xjh為自變量的多元線性回歸的回歸系數,即

Wj=(Xj′Xj)-1Xj′Zj

上述步驟反復迭代,直到權重變化不大,就認為收斂,得到最終的權重估計值,潛變量的得分就是可測變量的加權平均值。

下面給出前面四個問題的解答。

2. 問題解答。

(1)問題1的解答。通過算法概述可以看出,PLS路徑模型的最終目的雖然是得到潛變量得分,但是其本質是得到權重的估計。而權重的估計通過一系列的最小二乘方法反復迭代得到,即迭代過程中本質上涉及到一系列的線性回歸模型。目前已有一些學者討論了PLS路徑模型的最小樣本量,這些研究的主要依據是算法中涉及最大回歸方程需要的樣本量作為PLS路徑模型的最小樣本量。例如,Chin. W.W(1998)認為其最小樣本量應該為最大結構方程中自變量個數的10倍。梁燕和金勇進(2007)從最大回歸方程、準確估計參數、準確估計R2三個角度研究認為,樣本量至少需要100,最好在230以上。但是這些研究都是從PLS路徑模型作為統計方法出發的。不能回答綜合評價需要的樣本量。

根據綜合評價的理論,綜合評價的目的在于科學決策(杜棟等,2008),首先要求評價結果能夠客觀反映世界的真實情況。這就要求樣本需要能夠具有普遍性,因此樣本量是否足夠不僅需要考慮PLS路徑模型本身,還需要考慮樣本是否具備代表性,過小的樣本量將帶來較大的誤差。其次,要求參與建模的統計模型能夠客觀地挖掘總體信息,達到樣本推斷總體的效果。這樣才能針對總體情形進行科學決策。為此,需要首先回答PLS路徑模型挖掘樣本的何種信息,可以證明(Dijkstra. T,1983),PLS路徑模型的權重估計是一個不動點估計問題,具體為:

反映型:Wj∝?撞i:i?圮jeji?SjiWi,其中Wj′SjjWj=1;

構成型:Wj∝S-1jj?撞i:j?圮ieji?SjiWi,其中Wj′SjjWj=1

其中,Sji為第j組可測變量與第i組可測變量的樣本協方差矩陣,Sjj是第j組可測變量的樣本方差矩陣。上述等式說明了兩點事實:

①對于權重估計的信息來自可測變量的樣本協方差矩陣,權重可以看成是樣本協方差矩陣的函數;

②PLS路徑模型挖掘樣本信息,是一種非參數方法。

這就意味著PLS路徑模型進行綜合評價、科學決策的前提是樣本協方差矩陣與總體協方差矩陣足夠接近,這與CB-SEM對樣本量的要求是相同的。因此,本文認為,在綜合評價框架下,所謂PLS路徑模型適合小樣本的說法并不合適,為了進行科學決策,樣本量越大越好。從樣本協方差矩陣接近總體協方差矩陣的角度考察,PLS路徑模型的樣本量要求不低于CB-SEM的樣本量要求。

(2)問題2的解答。由于PLS路徑模型的估計問題實質上是一個不動點問題,且估計方法為基于最小二乘的迭代算法,因此該方法本質上是一種非參數方法,從數學上而言,樣本是不需要分布假定的。目前文獻中通用的算法僅對其一階矩有約束(Vinzi.V.E et al.,2010),

E(?孜jh|?孜j)=E(?孜j|xj1,…,xjpj)=0

E(?孜i|?孜j)=■?茁ij?孜j

(3)問題3的解答。關于PLS路徑分析進行綜合評價可以消除多重共線性(多重相關性)的提法首見于王惠文和付凌暉(2004),其后又有若干文獻有類似提法。根據這些文獻的說法,“系統評估指標體系往往被分為若干個變量組,由每個變量組表達一個主題概念。在這種情形下,所建立的評估指數應能夠反映指標體系的層次性”,利用PLS路徑模型可以解決這些問題。事實上,這樣的做法類似層次分析法,不同的是前者利用可測變量間的線性關系結構作為賦權依據,后者依賴專家評分(寧祿喬,2006)。但是這不意味著利用PLS路徑模型就能解決多重共線性問題。我們指出,如果測量模型僅為反映型模型,且不考慮路徑系數,那么多重共線性確實可以得到解決。除此之外,還存在其他的多重共線性問題。

①測量模型中可測變量的多重共線性。這種情況發生在測量模型為構成型,或者混合型(構成型和反映型的混合)時。原因在于,同一組可測變量都刻畫一個潛變量,這些可測變量必然相關。

②結構模型中的多重共線性。當需要考察路徑系數時,如果結構模型中解釋變量多于一個,這種情況就需要引起注意。原因在于,得到潛變量得分估計后,需要通過最小二乘方法估計路徑系數,如果解釋變量多于一個,本質上就是潛變量之間的多元線性回歸。這時就會面臨多元線性回歸的多重共線性問題。

為了解決這些問題,需要對算法進行修正。Vinzi.V.E et al.,(2010)建議在迭代過程的權重更新階段和路徑系數估計階段用PLS回歸方法代替OLS方法。

(4)問題4的解答。由于PLS路徑模型進行綜合評價是通過對可測指標賦權,得到潛變量得分,從而進行綜合評價。因此討論其客觀性本質上關注的是權重的客觀性。在綜合評價框架下,計算權重大致可分為兩類,一是主觀權重,由專家判斷得到;另一類是客觀權重,由實際數據產生(杜棟等,2008)。通過其算法和評價步驟,我們認為PLS路徑模型并非完全的客觀評價方法。原因在于對可測變量的分組是主觀的。其客觀性體現在權重基于可測變量的方差-協方差結構,這是由權重的不動點性質決定的。根據數理統計知識,方差-協方差結構與變量間的線性關系有密切的聯系,因此可以認為PLS路徑模型挖掘了各變量間完全的線性關系(吳喜之,2013)。

同時需要指出,可測變量間的方差-協方差結構對權重關系密切,對可測變量的量綱處理將影響權重的客觀性。如果對可測變量進行標準化,使其均值為0,方差為1,則可測變量的方差-協方差矩陣退化為相關系數矩陣。這樣,可測變量本身的變異信息將不能被權重反映出來,權重僅反映變量之間的相關關系信息。為此,在對可測變量進行去量綱處理時,應該保留其本身的變異信息。可以采用孟勝旺(1992)的處理辦法。

三、 結論和建議

本文對PLS路徑模型應用于綜合評價時的幾個“優點”進行了審視,指出①在綜合評價框架下,PLS路徑模型適合小樣本不能作為優點看待,進行綜合評價時,樣本越大越好,使得樣本方差-協方差矩陣與總體方差-協方差矩陣充分接近。關于樣本量的要求,可以參考CB-SEM;②從數學上而言,PLS路徑模型確實不需要分布假定,只需要滿足幾個一階矩的約束即可;③對于測量模型為反映型時,如果僅考察潛變量得分,PLS路徑模型確實可以克服多重共線性。但是當測量模型為構成型或者混合型時,或者需要考察路徑系數時,該方法并不能克服多重共線性,需要對算法進行改進;④PLS路徑模型不是完全的客觀評價方法,需要對可測變量主觀分組,其客觀性體現在權重估計基于樣本的方差協方差信息。

對于使用該方法,除了已有文獻(如Tenenhaus M 2005)給出的建議之外,本文提出如下建議:

(1)應該根據實際問題,對可測變量合理分組,確定測量模型的類型,確定結構模型形式;

(2)在數據處理階段,應該保留可測變量本身的變異,例如可以用原始變量除以均值代替標準化;

(3)樣本量越大越好,不建議對小樣本進行綜合評價,從理論上而言,沒有意義;

(4)當需要考察路徑系數時,以及測量模型為構成型和混合型時,需要注意多重共線性的影響。

參考文獻:

1. 杜棟,龐慶華,吳炎.現代綜合評價方法與案例精選(第二版).北京:清華大學出版社,2008.

2. 關子明,常文兵,王薇.基于結構方程模型的銀行員工績效考核方法.經濟論壇,2009,(2):108-109.

3. 梁燕,金勇進.顧客滿意度模型的樣本量研究.統計研究,2007,(7):68-74.

4. 劉旭華.基于PLS通徑分析的上市公司財務指標綜合評價.數理統計與管理,2008,(4):695-700.

5. 林海明,杜子芳.主成分分析綜合評價應該注意的問題.統計研究,2013,(8):25-31.

6. 林盛,劉金蘭,韓文秀.基于PLS-結構方程的顧客滿意度評價方法.系統工程學報,2005,(6):653-656.

7. 孟生旺.用主成份分析法進行多指標綜合評價應注意的問題.統計研究,1992,(4):67-68.

8. 莫一魁,沈旅歐.城市公交系統公眾評價的偏最小二乘通徑模型.深圳大學學報(理工版),2009,(4):436-440.

9. 寧祿喬.PLS算法研究.天津大學學位論文,2006.

10. 區晶瑩,張淞琳,俞守華.基于偏最小二乘通徑模型的農民工信息能力綜合評價.農業系統科學與綜合研究,2011,(4):495-501.

基金項目:國家自然科學基金(項目號:11361019);廣西自然科學基金重點項目(項目號:2013GXNSFDA019001);中國人民大學科學研究基金項目“縱向邊際化隨機效應模型應用研究”(項目號:13XNF058)。

統計學路徑分析范文5

[關鍵詞]醫療資源;配置;空間要素;管理;優化;GIS

doi:10.3969/j.issn.1673 - 0194.2017.04.102

[中圖分類號]R197.1 [文獻標識碼]A [文章編號]1673-0194(2017)04-0-01

1 基于空間要素的醫療資源配置重構優化模型研究背景

看病難是當前醫院管理遇到的重大問題,是國家醫療改革中急需解決的問題之一。造成看病難的原因是多方面的,但是醫療資源配置不合理是其中重要的原因之一。當前,醫院在設計門診大樓,配備門診醫療資源時,更多的是從業務管理、行政管理等方面出發。目前,有部分研究者對醫療資源設置合理性進行了初步探索,比如:將重癥監護室同手術室以及輸血科臨近設置,保證手術病人能夠在最短時間內送達監護室,并且一旦有用血需求時能夠在最短時間內從輸血科取得血制品等。

目前,很少有醫療機構能夠從患者就診角度出發,設計門診流程及配備醫療資源,導致患者進入醫院后,在各個就醫節點上花費大量的時間,將大部分時間浪費到排隊等待以及多部門的往返移動上,特別是行動不便者,更是身心疲憊。

醫院加強了標志的設置,提供了多種多樣的預約掛號、繳費結算手段,但是由于醫療活動的特殊性,醫生與患者需要面對面的溝通、診療,以及必需的醫技檢查檢驗等,導致患者不能完全脫離醫院完成就診流程。因此,利用信息化手段僅僅能夠將院前的時間盡可能減少,但是對于整個在院期間的時間減少并沒有太明顯的效果。

從本質上來說,在當前醫療就診流程情況下,優化調整醫院醫療資源的配置,利用多種多樣的信息化系統,是在我國當前醫療環境下解決看病難、等候時間長這一難題的辦法之一。

2 基于空間要素的醫療資源配置重構優化模型的研究區域

本研究區域是河北省某所大型三甲綜合醫院的門診區域。為了保證空間數據的準確性,本研究將大樓圖紙的CAD文件導入ARCGIS系統中,構建了包含移動路徑的空間模型。

在此研究中,筆者選取了門診患者量較大的外科、內科診區、超聲、內鏡及檢驗科等醫技科室作為研究目標,收集了門診的診室數量、出診醫生、醫技科室一線窗口人員數量及科室檢查設備數量等信息,將其空間化導入空間數據庫中。患者數據的收集則采用門診隨機抽取并全程跟隨的方式,記錄患者前往特定區域,如門診、檢查檢驗科室的路徑花費時間、等候時間、醫療服務接受時間等數據,根據患者移動路徑創建患者移動模型。

使用蒙特卡洛多次模擬方法,按照掛號―就診―繳費―檢查―取藥的就診流程,得出患者移動到特定環節的平均花費時間,最終可以得到特定患者一個標準就診流程的時間。模型可以得到患者在各個環節花費的時間和總體在醫院就診花費的時間。

在空間模型中,研究者可以調整任意空間要素的位置,比如:將一個包含了就診醫生等信息的外科診室作為一個空間要素,由原來的二層位置調整到其他位置,并利用路徑分析及蒙特卡洛模擬計算出患者移動到新位置的平均時間。

通過與真實數據時間花費進行比較,研究者能夠評估調整后位置對于減少患者就診時間是否有改善。利用本模型,管理者能夠探索多種醫療資源配置模式,從而找出最佳的配置方案。先在模型上充分模擬,減少了對臨床一線的影響,也提高了管理決策的合理性,幫助醫院投入最少的資源實現資源最優化配置。

3 結 語

在國家不斷深化醫療體制改革,要求醫院不斷提升管理水平,提高患者就診滿意度的背景下,優化門診醫療資源配置是醫療管理者關注的問題之一。現有的醫療資源配置方案,大多根據經驗來實施。方案的出發點往往從醫療行政管理方面出發,比如:將同類診室聚集到一個區域,醫技科室聚集到另一個區域。但是這樣的配置方式對于患者就診來說并不方便,例如:前往本次研究的內科就診的患者,往往需要到某個特定的醫技科室去就診,而此科室距離內科診區較遠,患者需要花費許多時間到指定區域。

通常調整醫療資源配置是一項花費時間、金錢、涉及科室協調的復雜工程,特別是一旦投入使用后進行更改非常困難。因此,許多醫院的管理者即使發現了不合理的配置,也很難下定決心進行調整,因為管理者不清楚如何配置才是當前情況下最優的方案。

利用統計學的方法和空間分析技術,能夠將醫療資源變化為空間要素,從而能夠發現任意要素的調整變化對于整個門診就診流程的影響。通過計算機技術和統計學方法,可以橢醫院管理者以更低的成本和代價,獲得可信的,有數據支持的配置方案,幫助醫院管理者作出符合醫院自身實際情況的決策,從而使患者有更好的就診體驗。

主要參考文獻

[1]王昕,鄭昂.新醫改進程中的公立醫院管理面臨的挑戰[J].醫學與哲學,2012 (15).

[2]侯捷,倪虹,李穎暉.關于某醫院門診就診滿意度調查與分析[J].數理醫藥學雜志,2016(1).

統計學路徑分析范文6

關鍵詞:Web 挖掘;數據挖掘

引 言

近年來,Internet在不斷地普及,WWW在迅速地發展,人們可以通過網絡方便地得到自己需要的信息,但是網上信息的大量涌現使得用戶經常感到束手無策,甚至常常不知道如何查找自己所需要的信息,用戶為此苦惱萬分。Web數據挖掘技術提供一個很好的解決方法,它不但可以為訪問用戶提供方便,而且對提高站點效率、吸引客戶等都有很大的幫助。

在現實當中人們常常將Web挖掘與Web信息檢索或信息抽取等同起來。實際上它們不是等同的,并且是有區別的:一、信息檢索只能以關鍵詞去查找與關鍵字匹配的簡單目標,如果用戶給出的不是關鍵字,而是信息樣本,這時信息檢索就無法滿足用戶的要求,但是挖掘系統是可以滿足用戶要求的,它能夠從文本中提取出目標信息的特征,然后根據目標特征在網絡中有目的地進行搜索,最后將搜索結果返給用戶。二、信息檢索實際上是在一定的領域內對特定的信息進行查找和檢索,在某種程度上可以看作是Web挖掘中文檔分類的一種特殊情況。三、信息檢索只是一部分使用到了數據挖掘技術,正是因為這樣,在信息檢索中在一般情況下是很難發現隱式的數據聯系,而Web挖掘卻不同,它能從大量看似無關的數據中發現數據聯系和知識,并對于決策給予支持。

1 Web挖掘

Web挖掘是利用數據挖掘技術從Web頁面內容、頁面之間的關系與結構、用戶的訪問記錄等Web數據中提取滿足用戶目標的有用知識、有用信息,以便為Web用戶的訪問提供方便或為網站經營者改善站點結構提供決策支持等[1]。Web挖掘不是一個單一的技術,涉及互聯網技術、統計學、信息學等多個領域[2]。Web挖掘過程可分為多個處理階段:確定挖掘目標、準備源數據、數據選擇及數據預處理、數據挖掘及模式識別、分析評價等階段。

傳統數據庫中的數據都是結構化的數據,而Web上的數據是半結構化的,半結構化是相對于數據庫中的結構化數據而言的。由于Web的異構性、動態性與開放性等特點,要從這些分散的、沒有統一管理的、異構的大量數據中準確、迅速地獲取信息是Web挖掘要解決的問題,這也決定了在進行Web挖掘時不能完全依賴于數據庫的挖掘技術。面向Web的數據挖掘比面向數據庫的數據挖掘要復雜很多,進行Web挖掘要考慮很多問題[3]。

1.數據來源分析。進行Web挖掘時所需要的數據主要來自于三個方面:Web服務器上記錄的訪問日志、Web服務器上的頁面所包含的信息以及客戶的相關資料信息。用戶訪問Web 站點時,站點會記錄其訪問記錄。借助一些工具可以處理和分析Web服務器上的日志文件從而得到有意義、有價值的信息。Web服務器還可以記錄用戶其他的訪問信息,例如:Cookie和用戶提交的查詢信息等。與此同時,服務器也記錄文件的相關屬性,例如文件的創建者、修改時間等。而注冊用戶的資料信息存儲在資料數據庫中,內容如:客戶的姓名、年齡,對于產品的看法,顧客的個人偏好等。Web挖掘的一個難點就是如何從非結構化數據信息中進行有效地信息和數據挖掘。

2.異構數據庫環境。從數據庫角度來看,Web網站上的信息也可以被當作一種特殊的、復雜的數據庫。互聯網上的任何站點都是數據源,而且都是異構的數據源,因而站點之間的信息和組織都是有差別的,這就構成了一個巨大的異構數據庫環境。如果想在這個巨大的異構數據庫上進行數據挖掘必須解決幾個問題。第一,必須要想辦法把這些分布的數據集成起來,只有將這些不同站點的數據都集成在一起,提供給用戶一個統一的視圖,才有可能從巨大的數據資源中獲取所需的信息或知識。第二,還要解決Web上的數據查詢問題,如果不能快速、準確地查找這些數據,就不能對這些數據進行分析、集成和處理。

3.半結構化的數據結構。數據庫中的數據和Web上的數據有著很大的不同,數據庫中的數據都是根據一定的數據模型來進行具體描述的。而Web上的數據則不同,它沒有特定的數據模型來描述,各Web站點的數據是獨立設計出來的,之間的差異很大,并且在自述性和動態性上也表現得相當的大的差異。因而,Web上的數據的結構性不是很強,只能說有一定的結構性,同時因自述層次的存在,Web上的數據是一種非完全結構化的或者是半結構化數據。半結構化是Web上數據的最大特點。

4.半結構化的數據源問題的解決。由于數據源的特殊性,要進行Web數據挖掘第一步就建立半結構化數據源模型和半結構化數據模型,解決其中的集成和查詢難題。這就必須要建立一個模型來來對Web上的數據進行描述。Web上的半結構化的數據需要定義一個半結構化的數據模型和模型的抽取技術來對現有數據自動地的抽取半結構化模型。面向Web數據挖掘的前提條件就是半結構化模型和半結構化數據模型抽取技術這種技術。

Web挖掘的基本構架如下圖所示:

2 Web數據挖掘中的常用技術

常用的Web數據挖掘中技術包括:路徑分析技術,關聯規則挖掘技術、序列模式挖掘技術和聚類分類技術等[3]。下面對它們進行簡單的分析:

1.路徑分析技術

對Web數據挖掘時,路徑分析技術比較常用的是運用圖的方法。因為我們可以用一個有向圖來表示Web站點,即:G=(P,I),P代表了頁面的集合,每一個頂點就是一個頁面,I表示的事頁面之間的超連接的集合,有向圖中的邊被定義為頁面之間的超鏈接。以頂點v為頭的邊來表示對v的引用,以頂點v為尾的邊定義為v引用了其他的頁面值,這樣形成網站結構圖[4]。

主站蜘蛛池模板: 精品久久久久久久中文字幕 | 欧美色图第一页 | 国产高清在线播放免费观看 | 亚洲专区欧美 | 好看的电影网站亚洲一区 | 欧美日韩国产一区二区三区 | 欧美日韩国产在线 | 国产成人亚洲综合 | 欧美日韩在线一区二区三区 | 国产亚洲欧美精品久久久 | 国产高清不卡一区二区三区 | 欧美 日韩 亚洲另类专区 | 久久99精品久久 | 美女一区 | 国产免费观看视频 | 久久国产精品免费一区二区三区 | 欧洲亚洲欧美国产日本高清 | 国产精品成人久久久久久久 | 欧美精品一二三 | 国产精品欧美韩国日本久久 | 亚洲一区二区视频在线观看 | 国产成人99久久亚洲综合精品 | 免费国产一区 | 国内精品一区二区三区最新 | 亚洲 欧美 手机 在线观看 | 91亚洲国产成人久久精品网址 | 91中文字幕在线 | 全网毛片免费 | 极品色在线精品视频 | 国产产一区二区三区久久毛片国语 | 久久国产毛片 | 插欧美 | 国产视频资源在线观看 | 视频亚洲一区 | 看全黄大色大黄美女 | 成人三级在线 | 日本一区二区三区在线播放 | 欧美一区二区三区四区在线观看 | 亚洲 欧美 中文字幕 | 国产精品亚洲片在线观看不卡 | 一区二区三区视频在线 |