2018年5月23日 星期三

數據分析


Excel 函數 中文意義 語法
sum 加總 =sum(B2:B11) 從B2到B11做加總
count 計數 =count(range)
average 平均數 =average(range)
varp 母體變異數
standarize 正規化 =standarize(x,mean,stdevp)
median 中位數
mode 眾數
sqrt 開根號
rank 排名
round 四捨五入 =round(range,小數點第幾位)
trunc 小數捨去
IF 如果 =IF(condition, true, false)
min 最小值
max 最大值
slope 斜率
power 次方
pi 圓周率
exp 指數
fact 階乘
permut 排列
combine 組合
log 對數
ln 自然對數
sumif =sumif(condition,true,false)

期望值
‹X›=E(X)=∑ xi p(xi)=∑xi ⁄n
‹ aX+b ›=a<X>+b=E(aX+b)=aE(X)+b

加權總分=∑ wi xi
加權平均=∑ wi xi ⁄ ∑ wi

變異數
var(X)=∑(xi-μ)2/n=∑xi2/n - μ2
var(aX+b)=a2 var(X)

var(X)=<(X-<X>)2>=<X2-2X<X>+<X>2>=<X2>-<X>2
var(aX+b)=<(aX+b-<aX+b>)2>=a2<(X-<X>)2>=a2<(X-<X>)2>=a2var(X)

標準差=√ 變異數
σ(X)=√var(X)
σ (aX+b)=|a|σ(X)

Lab
X={1,2,3,4,5}
X+2={2,4,6,8,10}
3X={3,6,9,12,15}
3X+2={5,8,11,14,17}
solve the list
<X>,<X+2>,<3X>,<3X+2>
var(X),var(X+2),var(3X),var(3X+2)
σ(X),σ(X+2),σ(3X),σ(3X+2)

標準化
X'=(X-μ)/σ

正規化
[min,max]--->[0,1]

(max-x)/(max-min)=(1-x)/1

x in [min,max]---> x=? in [0,1]


相關係數r
正相關r> 0,負相關r<0,零相關r=0
Sxy=∑i(xix)(yiy)
Sxx=∑i(xix)2
Syy=∑i(yiy)2
r=Sxy/√(Sxx Syy)

迴歸線
y-μy=Sxy/Sxx(x-μx)
斜率=slope=Sxy/Sxx