SAS頻率分布

2018-12-15 16:17 更新

頻率分布是示出數(shù)據(jù)集中的數(shù)據(jù)點(diǎn)的頻率的表。 表中的每個(gè)條目包含特定組或間隔內(nèi)的值的出現(xiàn)頻率或計(jì)數(shù),并且以這種方式,表概括了樣本中的值的分布。

SAS提供了一個(gè)稱(chēng)為PROC FREQ的過(guò)程來(lái)計(jì)算數(shù)據(jù)集中數(shù)據(jù)點(diǎn)的頻率分布。

語(yǔ)法

SAS中計(jì)算頻率分布的基本語(yǔ)法是:

PROC FREQ DATA = Dataset ;
TABLES Variable_1 ;
BY Variable_2 ;

以下是使用的參數(shù)的描述:

  • Dataset是數(shù)據(jù)集的名稱(chēng)。
  • Variables_1是需要計(jì)算其頻率分布的數(shù)據(jù)集的變量名稱(chēng)。
  • Variables_2是對(duì)頻率分布結(jié)果進(jìn)行分類(lèi)的變量。

單變量頻率分布

我們可以使用PROC FREQ確定單個(gè)變量的頻率分布。 在這種情況下,結(jié)果將顯示變量的每個(gè)值的頻率。 結(jié)果還顯示百分比分布,累積頻率和累積百分比。

在下面的例子中,我們找到名為CARS1的數(shù)據(jù)集的變量馬力的頻率分布,該數(shù)據(jù)集是從庫(kù)SASHELP.CARS創(chuàng)建的。 我們可以看到結(jié)果分為兩類(lèi)結(jié)果。 一個(gè)為汽車(chē)的每一個(gè)。

PROC SQL;
create table CARS1 as
SELECT make,model,type,invoice,horsepower,length,weight
 FROM 
SASHELP.CARS
WHERE make in ('Audi','BMW')
;
RUN;

proc FREQ data=CARS1 ;
tables horsepower; 
by make;
run;

當(dāng)執(zhí)行上面的代碼中,我們得到以下結(jié)果:

多變量頻率分布

我們可以找到多個(gè)變量的頻率分布,將它們分組成所有可能的組合。

在下面的例子中,我們計(jì)算按汽車(chē)類(lèi)型分組的汽車(chē)制造的頻率分布,以及按每種制造分組的每種類(lèi)型汽車(chē)的頻率分布。

proc FREQ data=CARS1 ;
tables make type; 
run;

當(dāng)執(zhí)行上面的代碼中,我們得到以下結(jié)果:

頻率分布與重量

使用權(quán)重選項(xiàng),我們可以計(jì)算用變量的權(quán)重偏置的頻率分布。 這里,變量的值被取為觀察值的數(shù)量,而不是值的計(jì)數(shù)。

在下面的例子中,我們計(jì)算變量make和type的頻率分布,分配給馬力的權(quán)重。

proc FREQ data=CARS1 ;
tables make type; 
weight horsepower;
run;

當(dāng)執(zhí)行上面的代碼中,我們得到以下結(jié)果:


以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)