R實戰第十篇:列聯表和頻數表 | r建立列聯表
摘要:列聯表是觀測資料按兩個或更多屬性(定性變數)分類時所列出的頻數分佈表,它是由兩個以上的變數進行交叉分類的頻數分佈表。互動分類的目的是將兩變數分組,然後比較各組的分佈狀況,以尋找變數間的關係。按兩個變數交叉分類的,該列聯表稱為兩維列聯表;若按3個變數交叉分類,所得的列聯表稱為3維列聯表,依...列聯表是觀測資料按兩個或更多屬性(定性變數)分類時所列出的頻數分佈表,它是由兩個以上的變數進行交叉分類的頻數分佈表。互動分類的目的是將兩變數分組,然後比較各組的分佈狀況,以尋找變數間的關係。按兩個變數...
摘要: 列聯表是觀測資料按兩個或更多屬性(定性變數)分類時所列出的頻數分佈表,它是由兩個以上的變數進行交叉分類的頻數分佈表。互動分類的目的是將兩變數分組,然後比較各組的分佈狀況,以尋找變數間的關係。 按兩個變數交叉分類的,該列聯表稱為兩維列聯表;若按3個變數交叉分類,所得的列聯表稱為3維列聯表,依...
列聯表是觀測資料按兩個或更多屬性(定性變數)分類時所列出的頻數分佈表,它是由兩個以上的變數進行交叉分類的頻數分佈表。互動分類的目的是將兩變數分組,然後比較各組的分佈狀況,以尋找變數間的關係。
按兩個變數交叉分類的,該列聯表稱為兩維列聯表;若按3個變數交叉分類,所得的列聯表稱為3維列聯表,依次類推。一維列聯表就是頻數分佈表。頻數就是各個分組中屬性出現的次數。
頻數也稱“次數”,對樣本資料按某些屬性進行分組,統計出各個組內含個體的個數,就是頻數。
本文使用vcd包中的Arthritis資料集來演示如何建立列聯表。
一,建立頻數表頻數表用於探索類別型變數,常用table()和 xtabs()來建立頻數表:
table(var1, var2, ...,varN) xtabs(formula, data)引數註釋:
table()函式:使用N個類別變數(因子)建立一個N維列聯表, xtabs()函式:根據一個公式(~var1+var2+...+varN)建立一個N維列聯表。總體來說,要進行交叉分類的變數應出現在公式的右側,即 ~ 符號的右方,以+ 作為分割符。本文重點介紹一維列聯表和二維列聯表,對於高維列聯表,不做介紹。
函式prop.table()以列聯表作為引數,以margins定義的邊際把列聯表中的頻數表示為比例關係。
prop.table(table,margins)引數註釋:table是列聯表,margins是邊際列表,1是第一個分類變數,2是第二個分類變數
函式margin.table()以列聯表作為引數,以margins定義的邊際列表來計算頻數的和。
margin.table(table,margins)引數註釋:table是列聯表,margins是邊際列表,1是第一個分類變數,2是第...