人工智能 - 第18页

使用Excel文件创建数据框完整指南

让我们来看看如何使用Excel将Excel文件读取到Pandas数据框对象大熊猫. 代码1：使用读取Excel文件read_excel()熊猫的方法。 # import pandas lib as p...

05月12日 IT技术 742 次浏览发表评论

在现实世界中, 将通过从现有存储中加载数据集来创建Pandas DataFrame, 存储可以是SQL数据库, CSV文件和Excel文件。可以从列表, 字典以及字典列表等创建Pandas DataF...

05月12日 928 次浏览发表评论

Pandas Series是一维标记数组, 能够保存任何类型的数据(整数, 字符串, 浮点数, python对象等)。轴标签统称为编号. 标签不必是唯一的, 但必须是可哈希的类型。该对象同时支持基于整...

05月12日 804 次浏览发表评论

使用随机创建的数据集在Python中创建线性回归模型。线性回归模型线性回归极客生成训练集 # python library to generate random numbers from ran...

05月12日 IT技术 768 次浏览发表评论

先决条件：主成分分析独立成分分析(ICA)是一种机器学习技术, 用于从混合信号中分离出独立的信号源。与主成分分析侧重于最大化数据点的方差不同, 独立成分分析侧重于独立性, 即独立成分。问题：从混...

05月06日 890 次浏览发表评论

数据：可以是任何未经解释和分析的未经处理的事实, 值, 文本, 声音或图片。数据是所有数据分析, 机器学习和人工智能中最重要的部分。没有数据, 我们就无法训练任何模型, 所有现代研究和自动化都将徒劳...

05月06日 857 次浏览发表评论

主要成分分析：是用于减少数据量的工具。它使我们能够在不损失大量信息的情况下减小数据量。 PCA通过找到方差最大的原始变量的一些正交线性组合(主要成分)来减小尺寸。第一个主成分捕获数据中的大部分差异...

05月06日 932 次浏览发表评论

数据集：它是UCI机器学习存储库中的Kaggle提出的挑战之一 https://www.kaggle.com/uciml/breast-cancer-wisconsin-data 它是患有恶性和良性...

05月06日 1,704 次浏览发表评论

先决条件： K均值聚类–简介标准K均值算法的缺点： K-means算法的一个缺点是它对质心或均值的初始化很敏感。因此, 如果将质心初始化为"远距离"点, 则它可能最终没有与之关联的点, 并且同时, ...

05月06日 1,134 次浏览发表评论

先决条件：ML |线性回归线性回归是一种监督型学习算法, 用于计算输入(X)和输出(Y)之间的线性关系。普通线性回归涉及的步骤是：培训阶段：计算以最小化成本。预测输出：对于给定的查询点, 从下图...

05月06日 923 次浏览发表评论