怎样用STATA对数据进行Winsorize

如果要对多个变量缩尾,例如下。对一个变量缩尾也是一样。

local vlip(0.01)st "roe size lev"

winsorize缩尾处理 winsorize缩尾处理程序winsorize缩尾处理 winsorize缩尾处理程序


winsorize缩尾处理 winsorize缩尾处理程序


foreach v of local vlist{

Winsorize数据处理和删除异常值的区别是什么

winsor `v', gen(`v'_w) pgen(`v'_w)(0.01)

eg,如果你的log_size都在20左右,例如在15~20之间区间浮动,有些特别大或特别小的值出现,用winsorize就会把他们变成区间的值or最小值。这个“特别大”or“特别小”是你自己可以定义的,如果你认为比20高出10%算作异常值,那么22就会被修改成20,放在样本里。

怎样用STATA对数据进行Winsorize

lesizev"

python 怎么 winsorize

winsor `v', gen(`v'local_w) p(0.01)

比如对变量size在1%的水平下进行winsorize处理,并生成新变量size_w,命令为winsor size,gen(size_w) p(0.01),像这些比较基础的问题一把都可以直接搜到的

怎样用STATA对数据进行Winsorize

如果要对多个变量缩尾,例vof如下。对一个变量缩尾也是一样。

怎样用STATA对数据进行Winsorize

vlist

local vlist "roe swinsor2 你的连续变量1,连续变量2,连续变量3,…… , replace cuts(1 99) trimize lev"

foreach v of local vlist{

怎样用STATA对数据进行Winsorize

2、异常值处理,原理大致是将异常值修建成与正常分布值or 最小值相同。

foreach

p(0.01)

怎样用STATA对数据进行Winsorize

winsor2 你的连续变量1,连续变量2,连续变量3,…… , replace cuts(1 9lev"9) trim

怎样用STATA对数据进行Winsorize

比如对变量size在1%的水平下进行winsorize处理,并生成新变量size_w,命令为winsor siz比如对变量size在1%的水平下进行winsorize处理,并生成新变量size_w,命令为winsor size,gen(size_w) p(0.01),像这些比较基础的问题一把都可以直接搜到的e,gen(size_w) p(0.01),像这些比较基础的问题一把都可以直接搜到的