您好,欢迎访问三七文档
1STATA基本入門前言STATA是一個十分好用而且簡單的統計套裝軟體,透過輕鬆的資料輸入方式,而且簡單的指令,即可執行一般在計量經濟學上常用的計量模型。除了計量模型外,STATA的套裝軟體中也可執行統計學中的估計和檢定,甚至是多變量分析中的各項分析工具。因此,STATA可以說是一個相當強而有力的統計軟體。一、安裝STATA所須的記憶體容量不大,只有4.03MB。此外,安裝也相當簡單,只要在〝SETUP〞上點兩下,安裝完成後再分別輸入”Sn”、”Code”和”Key”即可開始使用。但是安裝過程中有一點必須注意的是,如下圖所示,有”Intercooled”和”Small”兩個選項。一般而言,為了方便日後要設定較大的記憶體容量來處理大筆的資料,通常選擇以”Intercooled”進行安裝。二、視窗介紹安裝完成後,點選桌面上STATA的圖示,視窗畫面如下圖所示。為了使畫以此項進行安裝2面美觀,我們可以將畫面拉到自己喜歡的地方,如下圖所示。為了保存這個視窗畫面,我們必須點選工具列上的”Prefs”下的”SaveWindowingPreferences”。如此一來,以後開啟STATA時都會以此視窗畫面呈現。指令的執行結果看這裡執行過的指令都會保留於此資料中的變數在這裡在此輸入指令3接下來,我們依序介紹四個視窗的功用:左上─Review:此一視窗用於記錄在開啟STATA後所執行過的所有指令。因此,若欲使用重複的指令時,只要在該指令上點選兩下即可執行相同的指令;若欲使用類似的指令時,在該指令上點一下,該指令即會出現在視窗”StataCommand”上,再進行修改即可。此外,STATA還可以將執行過的指令儲存下來,存在一個do-file內,下次即可再執行相同的指令。左下─Variables:此一視窗用於呈現某筆資料中的所有變數。換言之,當資料中的變數都有其名稱時,變數名稱將會出現在此一視窗中。只要資料有讀進STATA中,變數名稱就會出現。它的優點是(1)確認資料輸入無誤;(2)只要在某變數上點選兩下,該變數即會出現在視窗”StataCommand”上。右上─StataResults:此一視窗用於呈現並記錄指令執行後的結果。右下─StataCommand:此一視窗用於輸入所欲執行的指令。Note:以上四個視窗都可以從”Fonts”去更改字體大小。三、輸入資料(Enteringdata)在本小節中,我們將介紹如何把資料讀進STATA。但是在正式介紹之前,我們必須先對幾個一般性的指令(generalcommand)有所瞭解,說明如下:cd:即changedirectory,簡言之,告知STATA資料儲存的地方。例如當資料儲存在e槽的sample資料夾時,則必須先輸入cde:\sample。dir/ls:用來顯示目錄的內容。setmemory#m:設定記憶體的容量。例如:當有一筆龐大的資料要處理時,則可設定100mb的容量,此時可輸入setmemory100m。(輸入指令memory可以知道記憶體容量的大小以及使用情況。)setmatsize#:設定所需的變數個數。一般而言,不須對此部分進行設定,除非所欲處理的資料龐大或是當執行後出現matsizetoosmall的訊息時再進行修改即可。內建為40。setmoreoff/on:若欲執行結果以分頁的型式呈現時,則輸入setmoreon;若欲執行結果同時呈現時,則輸入setmoreoff。4help:求助鍵。後面必須接的是指令。說明如何使用該指令,例如:helpregress。search:求助鍵。後面可接任何文字。說明在何處可以找到該文字。例如:searchnormaldistribution。clear:清除鍵。用來刪除所有資料。接下來,根據資料類型或指令的不同,資料輸入的方法可分成以下四種:1、輸入EXCEL資料將EXCEL的資料輸入STATA的方式還可細分成以下兩種:將EXCEL的資料輸入STATA之前,必須先將資料存成csv檔,再利用指令insheet來讀資料。Example:當csv檔的第一列有變數名稱時:當csv檔的第一列沒有變數名稱時:直接複製EXCEL上的資料,再到STATA選取”Window”下的”DataEditor”,點選後會出現”StataEditor”工作表,再到”Edit”下選取”Paste”即可貼上資料。2、輸入ASCII的資料型態依ASCII的資料型態區分,將ASCII的資料輸入STATA的方式也有以下兩種:資料型態一:見sample1-3.txtNote:記住文字的設定方式(str#variablename)。cde:\sampledirmemorysetmemory10minsheetusingsample1-1.csvinsheetgenderidracesesschtypprgtypereadwritemathsciencesocstusingsample1-2.csvinfilegenderidracesesschtypstr10prgtypereadwritemathsciencesocstusingsample1-3.txt5資料型態二:見sample1-4.txt第二種的資料型態通常須要codebook。如下表所示。variablenamecolumnnumberid1-2eng3-4math5-6sex7micro8-9macro10-113、利用Do-fileeditor輸入資料將資料或是指令寫入Do-fileeditor,再執行即可。例如:將下面資料複製並貼在Do-fileeditor(選取”Window”下的”Do-fileeditor”)上,再選擇”docurrnetfile”執行即可。4、利用STATA的資料型態輸入除了以上三種方法之外,還可以開啟之前以STATA儲存的資料。infixid1-2eng3-4math5-6gender7micro8-9macro10-11usingsample1-4.txtcde:\sampleinputidfemaleracesesstr3schtypeprogreadwritemathsciencesocst147113pub14762535361108012pub2343341363618032pub35033494436153012pub3393140395150022pub2505942536151121pub24236423139102011pub1524151535657112pub17165726656160112pub15565555061136012pub16559706351end6Note:此一指令亦可用在讀取網路上的資料(use網址)。最後,將資料輸入的相關指令整理成下表。insheetreadASCII(text)datacreatedbyaspreadsheetinfilereadunformattedASCII(text)datainfixreadASCII(text)datainfixedformatinputenterdatafromkeyboarduseloadaStata-formatdataset四、探索資料(Exploringdata)為了更詳細地呈現出在資料探索時所需使用的相關指令,我們利用sample4-1來說明指令的用法。首先,利用前節所提及的資料輸入方法將sample4-1讀進STATA。在正式分析資料之前,我們可以利用一個log檔來儲存之後所要執行的指令以及所得到的結果。指令的表示方法如下:接下來,我們可以先利用下面的指令來檢視sample4-1的資料:count:可得樣本數。describe:描述資料來源以及資料大小。list:依序列出觀察值的各個變數值。codebook:描述資料的詳細內容。此外,我們就可以利用summarize、tabulate和tabstat等指令得到資料的敘述統計與基本特性。表示如下:summarize:列出資料的敘述統計。Example:summarizewrite,detailsumwriteifread=60(sum是summarize的簡寫)sumwriteifprgtype==academic(接在if之後的句子中的”=”要放兩個)usesample1-6.dtalogusingresult4-1,text(log檔的名稱為result4-1)7sumwritein1/40(只列出第1筆到第40筆資料)tabulate:列出變數的次數表。Example:tabulateprgtypetabulateprgtyperacetabulateprgtype,summarize(read)tabulateprgtyperace,summarize(write)tabstat:列出變數的敘述統計。Example:tabstatreadwritemath,by(prgtype)stat(nmeansd)tabstatwrite,stat(nmeansdp25p50p75)by(prgtype)接下來,我們介紹一些用來劃圖的指令:莖葉圖:stemwritestemwrite,lines(2)直方圖:graphwrite,bin(10)graphwrite,histnormalbin(10)箱形圖:graphwrite,boxsortprgtype(要先有這個指令才能執行下一個指令)graphwrite,boxby(prgtype)此外,利用correlate或是pwcorr可以得到相關矩陣;亦可利用graph劃出散佈圖。現在我們可以將log檔結束了,指令輸入如下:若欲檢視log檔中的結果,可以輸入指令:correlatewritereadsciencepwcorrwritereadscience,obsgraphwriteread,twowaygraphwriteread,twojitter(2)(two是twoway的簡稱,jitter是用來區分重疊的觀察點)graphwriteread,twojitter(2)boxgraphreadsciencewrite,matrixhalflogclosetyperesult4-1.log8或是到所儲存的目錄下點選。最後,將資料探索的相關指令整理成下表。countShowthenumberofobservationsdescribeDescribecontentsofdatainmemoryorondisklistListvaluesofvariablescodebookDetailedcontentsofadatasetlogCreatealogfilesummarizeDescriptivestatisticstabulateOne-&two-wayfrequencytablestabstatTableofdescriptivestatisticsstemStem-and-leafplotgraphHighresolutiongraphssortSortobservationsinadatasethistHistogramofacategoricalvariablecorrelateCorrelationspwcorrPairwisecorrelationstypeDisplayanASCIIfile五、修飾資料(Modifyingdata)在本小節中,我們亦利用sample4-1的資料進行說明。首先,讀進資料。讀完資料後,可以為此資料取個名稱,指令如下:現在我們可以將變數的順序作一排列。例如:原先的變數順序為gender、id和race…,但是我們想把順序改成id、gender和race…,則可以下面的指令來執行:在執行codebook時,我們會發現有些變數尚未加上標籤(label),為了更清楚地表達變數所代表的意義,我們可以執行以下的指令:labeldataHighSchoolandBeyond,200casesorderidgender9現在,我們想要產
本文标题:stata使用手册
链接地址:https://www.777doc.com/doc-2850653 .html