網友評分:
6.6分
Stata是一款集數據分析、數據管理以及繪制專業圖表的整合性統計軟件,它提供多種數據模型,包括線性混合模型、均衡重復反復及多項式普羅比模式,用Stata繪制的統計圖形相當精美。它的分析功能也是比較出眾的,可利用命令快速完成數據整理、導入導出等工作。
設置里可更改Stata語言:Edit > Preferences > User-interface language > 簡體中文
1、數據訪問功能
除了直接讀取自身格式的數據集外,Stata支持導入/導出很多其他格式的數據集,如常用的Excel格式、XML格式、SAS XPORT格式、文本格式及ODBC接口。如果數據很少,可以直接將數據手工錄入至Stata軟件。
2、數據管理功能
Stata為用戶提供了完善的數據管理功能,舉例如下:①Stata支持最多達32個字符的變量名,字符變量值支持長達20億字節(Stata區分字符大小寫);②利用數值函數或字符函數產生新變量;③自動由分組變量生成啞變量,自動將字符變量映射成數字代碼;④對數據文件進行橫向和縱向鏈接、行列變換等;⑤重復測量數據的長型格式和寬型格式相互轉換;⑥數值變量和字符變量相互轉換。
3、作圖功能
Stata可生成可供發表的高質量的圖形輸出。最常見的幾種基本圖形的制作:散點圖、線圖、面積圖、條圖、方向圖等自帶模型,一鍵生成。
4、統計分析功能
Stata的統計功能很強,除了傳統的統計分析方法外,還收集了近年來發展起來的新方法,其分析功能緊跟國際上數理統計方法學的最新進展。Stata 13增加了許多特性,如處理效應、多水平廣義線性模型、功效和樣本量、廣義結構方程模型、預測、效應量、刪失的連續性結局、單變量時間序列模型。更為令人稱贊的是,Stata在統計分析命令的設置上結構極為清晰,它將相同類型的統計模型均歸在同一個命令族下,而不同命令族又可以使用相同功能的選項,這使得用戶學習時極易上手。
5、矩陣運算功能
矩陣代數是多元統計分析的重要工具,Stata不但提供了多元統計分析中所需的基本矩陣運算,如矩陣的加、積、逆、Cholesky分解、Kronecker內積等,還提供了一些高級運算,如特征根、特征向量、奇異值分解等。在執行完某些統計分析命令后,還提供了一些系統矩陣,如估計系數向量、估計系數的協方差矩陣等。Stata 9.0以后版本完美地整合了執行矩陣計算的矩陣編程語言Mata,可進行強大的矩陣運算。
6、程序設計功能
Stata是一個統計分析軟件,但它也具有很強的程序語言功能,給用戶提供了一個廣闊的開發應用的天地。和矩陣運算功能相結合,用戶就能夠充分發揮自己的聰明才智,熟練應用各種技巧,對Stata的功能進行擴展(詳見第11章)。如Stata自身并無Meta分析命令,但是用戶們開發了一整套優秀的Meta分析命令集(詳見第12章),對Stata的功能進行了進一步擴展,使之成為當前最優秀的Meta分析軟件之一。
?
首先,打開stata軟件,我們需要確定自己安裝的命令是否已經在stata系統之中,簡單的一個測試方法便是在輸入框中輸入“help XXX”,以“fsum”命令為例,輸入“h fsum”。
如果沒有該命令,則會出現圖片的提示。這里也可以選擇“是”來軟件自動搜索,但是我們提供另外一個下載方式。
我們可以直接在stata命令窗口中輸入下載命令:“ssc install fsum”命令,點擊就安裝到本地了,一般放在C盤的ado文件夾里面。
等待下載,當出現以上圖樣的時候,命令便下載完成了。
最后檢驗一下新命令是否添加完成,采用上述方法輸入“h fsum”命令查詢即可。
利用命令導入:
use
1.insheet using filename, [option]
這個命令是專門用來導入像excel之類的以電子表格形式存儲的數據。在導入之前,首先要把excel文件轉存為STATA可以識別的格式。其中我最常用的就是另存為csv逗號分隔符格式。
然后在STATA中使用insheet讀取csv文件,在option中指定為comma告訴STATA你讀取的是csv文件。
這種方法有個不足在于如果你的數據中包含中文而且里面含有逗號時無法識別,解決的辦法是不要用逗號標示分隔符了,在excel中另存為txt(制表符分隔),這樣就不會與逗號相混淆了。然后再在insheet命令中在option里指定是tab,就完事了。
2.infile using filename
這個infile命令分兩類,一種是處理固定格式(fixed format)的txt或raw,另一種是處理自由格式(free format),當然你在用這個命令里還需要定義一個dictionary,這個dictionary是用來描述數據的組織方式的,需要自己根據要導入的數據文件自己編寫代碼,然后嵌套到數據文件txt的前面去,或者是單獨地存為一個dct文件,并且告訴STATA你要導入的數據在保存在哪里。
3.xmluse
這個命令首先要把xls文件另存為xml格式,然后用xmluse命令去讀取,當然在讀取時你也要在option中聲明你的xml文件是excel保存的而不是STATA保存的,這樣就不會弄錯。
如果你的xls文件中如果有漢字的話,STATA讀取后對應的變量會出現亂碼,這一點用insheet就不會有這個問題。
4.odbc
這個命令是專門讀取數據庫文件的,并且支持SQL命令,這樣如果你的數據比較多的話,可以先用SQL語句進行篩選,然后而導入。當然這個命令也能導向excel文件。
使用merge命令語法:merge [varlist] using filename [filename...] [,optione];其中[varlist]代表合并進去的新變量,using filename指的是所要與原文件合并的文件路徑
首先打開第一個源文件water1.dta,將它按year排序,然后再以覆蓋方式保存
再打開第二個源文件water2.dta,將它按year排序
用merge命令進行兩個文件的合并
保存合并后的結果,并查看合并后的數據
右擊圖表區域
更改圖表類型-帶平滑線和數據標記的散點圖
進入后選擇相應的模塊就好了
查看效果(OK)
或者使用命令twoway (scatter y x) (lfit y x)
“ lfit"表示”linear fit"(線性擬合),形狀為直線,如果想在散點圖上同時畫出二次回歸曲線,直接將“ lfit"改為“qfit",(二次擬合),形狀為曲線。
Step1:進行命令分析,如回歸分析(命令結果如下)
Step2:(輸入命令)outreg2 using myfile(結果導出命令)
Step3 :(輸入命令)findit outreg2(找outreg2命令)
Step4:點擊界面中的鏈接(fmwww.bc.edu),會出現 clink here to install 按鈕,點擊進入
Step5:(再次輸入命令)outreg2 using myfile(結果導出命令)就可以導出回歸結果了。