写在前面
在此总结一些在数据分析/发掘中可能用到的功能,利便大家索引或者从一种语言迁移到另外一种。固然,这篇博客还会随时更新(不会另起一篇,为了利便大家索引),请大家文章源自微观生活(93wg.com)微观生活-https://93wg.com/23307.html
pip install *文章源自微观生活(93wg.com)微观生活-https://93wg.com/23307.html
安装;同理,为了利便索引,R中也以 ::表示了函数和函数所在包的名字,文章源自微观生活(93wg.com)微观生活-https://93wg.com/23307.html
install.packages(\"*\")文章源自微观生活(93wg.com)微观生活-https://93wg.com/23307.html
安装。文章源自微观生活(93wg.com)微观生活-https://93wg.com/23307.html
连接器与io数据库IO类文章源自微观生活(93wg.com)微观生活-https://93wg.com/23307.html
excel | xlsxWriter, pandas.(from/to)_excel, openpyxl | openxlsx::read.xlsx(2), xlsx::read.xlsx(2) |
csv | csv.writer | read.csv(2), read.table |
json | json | jsonlite |
图片 | PIL | jpeg, png, tiff, bmp |
统计类回归(包含统计以及机器学习)文章源自微观生活(93wg.com)微观生活-https://93wg.com/23307.html
普通最小二乘法回归(ols) | statsmodels.ols, sklearn.linear_model.LinearRegression | lm, |
广义线性回归(gls) | statsmodels.gls | nlme::gls, MASS::gls |
分位数回归(Quantile Regress) | statsmodels.QuantReg | quantreg::rq |
岭回归 | sklearn.linear_model.Ridge | MASS::lm.ridge, ridge::linearRidge |
LASSO | sklearn.linear_model.Lasso | lars::lars |
最小角回归 | sklearn.linear_modle.LassoLars | lars::lars |
稳健回归 | statsmodels.RLM | MASS::rlm |
假定检修文章源自微观生活(93wg.com)微观生活-https://93wg.com/23307.html
t检修 | statsmodels.stats.ttest_ind, statsmodels.stats.ttost_ind, statsmodels.stats.ttost.paired; scipy.stats.ttest_1samp, scipy.stats.ttest_ind, scipy.stats.ttest_ind_from_stats, scipy.stats.ttest_rel | t.test |
ks检修(检修散布) | scipy.stats.kstest, scipy.stats.kstest_2samp | ks.test |
wilcoxon(非参检修,差异检修) | scipy.stats.wilcoxon | wilcox.test |
Shapiro-Wilk正态性检修 | 未知 | shapiro.test |
Pearson相关系数检修 | scipy.stats.pearsonr | cor.test |
时间序列生存分析机器学习类回归文章源自微观生活(93wg.com)微观生活-https://93wg.com/23307.html
参见统计类文章源自微观生活(93wg.com)微观生活-https://93wg.com/23307.html
分类器LDA、QDASVM(支撑向量机)
支撑向量分类器(SVC) | sklearn.svm.SVC | e1071::svm |
非支撑向量分类器(nonSVC) | sklearn.svm.NuSVC | 未知 |
线性支撑向量分类器(Lenear SVC) | sklearn.svm.LinearSVC | 未知 |
基于邻近
k-邻近分类器 | sklearn.neighbors.KNeighborsClassifier | 未知 |
半径邻近分类器 | sklearn.neighbors.RadiusNeighborsClassifier | 未知 |
邻近重心分类器(Nearest Centroid Classifier) | sklearn.neighbors.NearestCentroid | 未知 |
贝叶斯
朴素贝叶斯 | sklearn.naive_bayes.GaussianNB | e1071::naiveBayes |
多维贝叶斯(Multinomial Naive Bayes) | sklearn.naive_bayes.MultinomialNB | 未知 |
伯努利贝叶斯(Bernoulli Naive Bayes) | sklearn.naive_bayes.BernoulliNB | 未知 |
决策树
决策树分类器 | sklearn.tree.DecisionTreeClassifier | tree::tree, party::ctree |
决策树回归器 | sklearn.tree.DecisionTreeRegressor | tree::tree, party::tree |
随机森林分类器 | sklearn.ensemble.RandomForestClassifier | randomForest::randomForest, party::cforest |
随机森林回归器 | sklearn.ensemble.RandomForestRegressor | randomForest::randomForest, party::cforest |
聚类
kmeans | scipy.cluster.kmeans.kmeans | kmeans::kmeans |
分层聚类 | scipy.cluster.hierarchy.fcluster | (stats::)hclust |
包聚类(Bagged Cluster) | 未知 | e1071::bclust |
DBSCAN | sklearn.cluster.DBSCAN | dbscan::dbsan |
Birch | sklearn.cluster.Birch | 未知 |
K-Medoids聚类 | pyclust.KMedoids(可靠性未知) | cluster.pam |
文本、NLP基本操作
tokenize | nltk.tokenize(英), jieba.tokenize(中) | tau::tokenize |
stem | nltk.stem | RTextTools::wordStem, SnowballC::wordStem |
stopwords | stop_words.get_stop_words | tm::stopwords, qdap::stopwords |
中文分词 | jieba.cut, smallseg, Yaha, finalseg, genius | jiebaR |
主题模型
以上就是微观生活(93wg.com)关于“Python 以及 R 数据分析/发掘工具互查”的详细内容,希望对大家有所帮助!
评论