Python 以及 R 数据分析/发掘工具互查

小微 科技Python 以及 R 数据分析/发掘工具互查已关闭评论82字数 2497阅读模式
摘要写在前面在此总结一些在数据分析/挖掘中可能用到的功能,方便大家索引或者从一种语言迁移到此外一种。当然,这篇博客还会随时更新(不会另起一篇,为了方便大家索引),请大家pip inst...

写在前面

在此总结一些在数据分析/发掘中可能用到的功能,利便大家索引或者从一种语言迁移到另外一种。固然,这篇博客还会随时更新(不会另起一篇,为了利便大家索引),请大家文章源自微观生活(93wg.com)微观生活-https://93wg.com/23307.html

pip install *文章源自微观生活(93wg.com)微观生活-https://93wg.com/23307.html

安装;同理,为了利便索引,R中也以 ::表示了函数和函数所在包的名字,文章源自微观生活(93wg.com)微观生活-https://93wg.com/23307.html

install.packages(\"*\")文章源自微观生活(93wg.com)微观生活-https://93wg.com/23307.html

安装。文章源自微观生活(93wg.com)微观生活-https://93wg.com/23307.html

连接器与io数据库IO类文章源自微观生活(93wg.com)微观生活-https://93wg.com/23307.html

种别PythonR
excel xlsxWriter, pandas.(from/to)_excel, openpyxl openxlsx::read.xlsx(2), xlsx::read.xlsx(2)
csv csv.writer read.csv(2), read.table
json json jsonlite
图片 PIL jpeg, png, tiff, bmp

统计类回归(包含统计以及机器学习)文章源自微观生活(93wg.com)微观生活-https://93wg.com/23307.html

种别PythonR
普通最小二乘法回归(ols) statsmodels.ols, sklearn.linear_model.LinearRegression lm,
广义线性回归(gls) statsmodels.gls nlme::gls, MASS::gls
分位数回归(Quantile Regress) statsmodels.QuantReg quantreg::rq
岭回归 sklearn.linear_model.Ridge MASS::lm.ridge, ridge::linearRidge
LASSO sklearn.linear_model.Lasso lars::lars
最小角回归 sklearn.linear_modle.LassoLars lars::lars
稳健回归 statsmodels.RLM MASS::rlm

假定检修文章源自微观生活(93wg.com)微观生活-https://93wg.com/23307.html

种别PythonR
t检修 statsmodels.stats.ttest_ind, statsmodels.stats.ttost_ind, statsmodels.stats.ttost.paired; scipy.stats.ttest_1samp, scipy.stats.ttest_ind, scipy.stats.ttest_ind_from_stats, scipy.stats.ttest_rel t.test
ks检修(检修散布) scipy.stats.kstest, scipy.stats.kstest_2samp ks.test
wilcoxon(非参检修,差异检修) scipy.stats.wilcoxon wilcox.test
Shapiro-Wilk正态性检修 未知 shapiro.test
Pearson相关系数检修 scipy.stats.pearsonr cor.test

时间序列生存分析机器学习类回归文章源自微观生活(93wg.com)微观生活-https://93wg.com/23307.html

参见统计类文章源自微观生活(93wg.com)微观生活-https://93wg.com/23307.html

分类器LDA、QDASVM(支撑向量机)

种别PythonR
支撑向量分类器(SVC) sklearn.svm.SVC e1071::svm
非支撑向量分类器(nonSVC) sklearn.svm.NuSVC 未知
线性支撑向量分类器(Lenear SVC) sklearn.svm.LinearSVC 未知

基于邻近

种别PythonR
k-邻近分类器 sklearn.neighbors.KNeighborsClassifier 未知
半径邻近分类器 sklearn.neighbors.RadiusNeighborsClassifier 未知
邻近重心分类器(Nearest Centroid Classifier) sklearn.neighbors.NearestCentroid 未知

贝叶斯

种别PythonR
朴素贝叶斯 sklearn.naive_bayes.GaussianNB e1071::naiveBayes
多维贝叶斯(Multinomial Naive Bayes) sklearn.naive_bayes.MultinomialNB 未知
伯努利贝叶斯(Bernoulli Naive Bayes) sklearn.naive_bayes.BernoulliNB 未知

决策树

种别PythonR
决策树分类器 sklearn.tree.DecisionTreeClassifier tree::tree, party::ctree
决策树回归器 sklearn.tree.DecisionTreeRegressor tree::tree, party::tree
随机森林分类器 sklearn.ensemble.RandomForestClassifier randomForest::randomForest, party::cforest
随机森林回归器 sklearn.ensemble.RandomForestRegressor randomForest::randomForest, party::cforest

聚类

种别PythonR
kmeans scipy.cluster.kmeans.kmeans kmeans::kmeans
分层聚类 scipy.cluster.hierarchy.fcluster (stats::)hclust
包聚类(Bagged Cluster) 未知 e1071::bclust
DBSCAN sklearn.cluster.DBSCAN dbscan::dbsan
Birch sklearn.cluster.Birch 未知
K-Medoids聚类 pyclust.KMedoids(可靠性未知) cluster.pam

文本、NLP基本操作

种别PythonR
tokenize nltk.tokenize(英), jieba.tokenize(中) tau::tokenize
stem nltk.stem RTextTools::wordStem, SnowballC::wordStem
stopwords stop_words.get_stop_words tm::stopwords, qdap::stopwords
中文分词 jieba.cut, smallseg, Yaha, finalseg, genius jiebaR

主题模型

以上就是微观生活(93wg.com)关于“Python 以及 R 数据分析/发掘工具互查”的详细内容,希望对大家有所帮助!

继续阅读
 
小微
  • 版权声明: 本文部分文字与图片资源来自于网络,转载此文是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们(管理员邮箱:81118366@qq.com),情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
  • 转载请务必保留本文链接:https://93wg.com/23307.html