自我選擇取樣 (self-selected sampling) 舉例來說,參與call-in民調的電台聽眾,因為對於該議題感興趣而參與調查,這是聽眾的自我選擇。 這種取樣方式幾乎總是有偏差的。
中位數 (Median) 把資料加以排序,落在中間的數值,即為中位數。 若有偶數筆資料,則中位數是落在中間的2筆資料的平均。 中位數的意義在於有1半的資料中位數。 和算數平均數相比,中位數的好處是,不會受到極端值的影響。 舉例來說,有5名同學成績排序為: 50, 60, 70, 80, 90,則中位數為70。有1半的同學70分。
區間資料 (interval data, quantitative data, numerical data) 實數 (real numbers)。 可以對區間資料進行各種運算。 類別資料 (nominal data, qualitative data, categorical data) 舉例來說,變數是班長候選人,值域為「沈佳宜」、「柯景騰」。 有時我們會為類別指定數值。以上例而言,可以指定「沈佳宜」為1,「柯景騰」為2。
政治言詞、廣告主張、對公共議題的辯論——數字用來證明觀點或加強論據,我們每天都遭數字圍攻。利用數據來為某個目標爭論的人,是要支持那個目標,可不見得會很小心地引用數字,甚至不一定誠實。
如果有一位七十歲的老人在電視上說,他就是靠每天抽一包煙、嚼一包檳榔才能長壽,請想起「死人沒法上電視說話」這件事。同樣的道理,不是那個地方長壽的老人家吃或喝某東西,某東西就是養生聖品。