使用Python加速数据分析的十种简单技术 易世达股票

股票资讯  2021-03-06 21:05:13

使用Python加速数据分析的10个简单技巧

技巧和诀窍,尤其是在编程领域,可能非常有用。有时候,一点点技巧,可以节省时间和生命。一个小小的快捷方式或者附加组件有时被证明是天赐之物,可以真正提高生产力。因此,这里有一些我最喜欢的技巧和技术,我会以本文的形式一起使用和编译。有些可能是我们熟悉的,有些可能是新的,但我相信当你下次处理数据分析项目时,它们会派上用场。

1.分析熊猫数据框架

分析是一个帮助我们理解数据的过程,熊猫分析是一个执行这个过程的python包。这是一种简单快速的熊猫数据框架探索性数据分析方法。熊猫的df . description和df.info功能通常是EDA过程的第一步。但是它只提供了非常基本的数据概述,对大数据集没有帮助。另一方面,熊猫分析功能使用df.profile_report来扩展熊猫数据框架,以便进行快速数据分析。它在一行代码中显示了大量信息,甚至在交互式HTML报告中也是如此。

对于给定的数据集,熊猫分析包计算以下统计数据:

熊猫档案包统计。

固定

使用

让我们用古代泰坦尼克号数据集来演示多功能python分析器的功能。

编者按:本文发表一周后,熊猫-Profiling发布了一个主要的升级版本-2.0.0。语法发生了一些变化。其实它的功能已经包含在熊猫本身了,报告也变得更全面了。以下是最新的用法语法:

使用

要在Jupyter笔记本中显示报告,请运行以下代码:

您只需要这一行代码就可以在Jupyter笔记本中显示数据分析报告。报告非常详细,包括必要的图表。

您还可以使用以下代码将此报告输出到交互式HTML文件中。

有关更多详细信息和示例,请参考文档。

2.给熊猫图表带来互动性

熊猫有一个内置的。绘图函数,它是DataFrame类的一部分。但该功能呈现的可视化效果并不具有交互性,因此吸引力较小。相反,我们不能排除用熊猫画图表的便利性。数据图。绘图功能。如果不用大的代码改动就能像plotly一样用熊猫画交互图怎么办?实际上,您可以使用袖扣库来做到这一点。

图书馆袖扣结合了剧情的强大功能和熊猫的灵活性,便于绘画。现在我们来看看如何安装这个库,并让它在熊猫中运行。

固定

使用

是时候看看用泰坦尼克号数据集扩展的魔力了。

比较df.iplot和df.plot。

右边的可视化显示了静态图,而左边的图是交互式的,更详细,所有这些都没有在语法上做任何显著的改变。

3.一点魔法

Magic命令是Jupyter Notebook中的一组方便的函数,旨在解决标准数据分析中的一些常见问题。您可以使用%lsmagic命令查看所有可用的magic命令。

所有可用魔法功能的列表

魔法命令有两种:线条魔法和细胞魔法。前者以单个%字符作为前缀,对一行输入进行操作;后者与两个%%前缀相关联,并对多行输入进行操作。如果magic函数的选项设置为1,则无需键入首字母%即可调用。

让我们来看看一些在常见数据分析任务中可能有用的神奇函数:

% pastebin %Pastebin将代码上载到Pastebin并返回其url。Pastebin是一个在线内容托管服务,我们可以在其中存储纯文本,比如源代码片段,然后与他人共享URL。其实Github gist和Pastebin差不多,虽然有版本控制。

让我们假设有一个python脚本文件. py,它包含以下内容:

使用Jupyter笔记本中的%pastebin来生成pastebin的url地址。

%matplotlib笔记本 % mapplotlib内联函数用于在Jupyter笔记本中渲染静态mapplotlib绘图。试着用笔记本代替内嵌部分,你就可以很容易地得到可缩放和可调整大小的图形。请确保在导入matplotlib库之前调用此函数。

% mapplotlib内联与% mapplotlib笔记本

%运行 %run函数在笔记本中运行一个python脚本。

%%writefile %%writefile会将单元格的内容写入文件。这里的代码将被写入一个名为foo.py的文件,并保存在当前目录中。

% %乳胶 %%LaTeX函数将单元格中的内容呈现为LaTeX。这对于在单元格中编写数学公式和方程很有用。

4.发现并消除错误

交互式调试器也是一个神奇的函数,但我已经把它归为单一类了。如果运行代码单元格时出现异常,请在新行中键入%debug并运行它。这将打开一个交互式调试环境,它会将您带到异常发生的地方。您还可以检查程序中分配的变量值,并在此执行操作。要退出此调试器,请按q。

5.打印输出也可以很漂亮

如果您想为您的数据结构生成一个漂亮的表示,pprint是首选模块。当打印字典或JSON数据时,它特别有用。让我们看一个使用print和pprint同时显示输出的例子。

6.让评论脱颖而出

我们可以利用Jupyter Notebook中的信息提示/备注框,突出显示一些重要的或者需要突出显示的内容。便笺的颜色取决于您指定的提示类型。您所需要做的就是在需要突出显示的单元格中添加以下任何或所有代码。

蓝色信息提示框:信息

黄色信息提示框:警告

绿色提示框:成功

红色提示框:危险

7.在一个单元格中打印所有输出

假设您有一个包含以下代码行的Jupyter笔记本单元格:

只打印最后一个输出是单元格的正常属性,对于其他输出,我们需要添加打印功能。事实上,我们可以通过在笔记本顶部添加以下代码片段来打印出所有的输出。

现在所有的输出都是一个一个打印出来的。

恢复到原始设置:

8.使用“我”选项运行python脚本。

从命令行运行python脚本的典型方法是python hello.py..但是,如果您在运行相同的脚本时添加一个额外的-i,比如python -i hello.py,它将提供更多的优势。我们来看看。

首先,一旦程序完成,python不会退出解释器。因此,我们可以检查变量的值和程序中定义的函数的正确性。

其次,我们可以用下面的代码轻松调用python调试器,因为我们还在解释器中:

这将把我们带到异常发生的地方,然后我们可以处理代码。

这个技能的最初来源。(http://www.bnikolic.co.uk/blog/python-running-cline.html)

9.自动注释代码

ctrl/Cmd+/自动注释单元格中的选定行。再次点击组合键取消同一行代码的注释。

10.可以删除的是人,可以恢复的是神。

你有没有不小心删了Jupyter笔记本里的一个单元格?如果是这样,这里有一个快捷方式来撤销这个删除操作。

如果您删除了一个单元格的内容,您可以通过按ctrl/cmd+z轻松恢复它。 如果需要恢复已删除的单元格,请单击ESC+Z或编辑>:撤消删除单元格

结论

在这篇文章中,我列出了我在使用Python和JupyterNotebook时收集的主要技巧。相信它们会对你有用,你会从这篇文章中学到一些东西,从而实现轻松编码!

本文来源:https://towards tasciety . com/10-simple-hacker-to-speed-you-data-analysis-in-python-EC 18 c 6396 e6b?Gi=4aa49620b返回搜狐看更多

负责编辑:


以上就是使用Python加速数据分析的十种简单技术易世达股票的全部内容了,喜欢我们网站的可以继续关注琦媛股票网其他的资讯!

相关推荐

顺发恒业:子公司恒业拟收购两家风电公司股权投资清洁能源产业
6月18日,首创获悉,A股公司顺发恒业(000631.SZ)全资子公司收购股权。公司积极响应国家"碳达峰、碳中和"号召,探索清洁...
诺华完成5.5亿元C轮融资
5月8日,国都获悉,据IT橙讯报道,南京诺华生物科技有限公司近日宣布完成5.5亿元C轮融资,由国寿健康基金、夏尔巴投资等领投。关...
中国保险研究院公布理想ONE安全评估结果:GGGM
1月25日,首府从中国保险汽车安全指数(以下简称"中国保险学会")(C-IASI)官网获悉,首款量产车型IdealONE的测评结...
央行和中国证监会扩大了这一举措:107.7万亿元人民币的债券相互关联
19日,央行和证监会联合发布公告,同意在交易所债券市场开展银行与相关基础设施机构互联互通。数据显示,2020年6月底,中国债券市...
没有达到业绩目标的游戏站没收了CEO近1亿美元的股权奖励
4月15日,首府获悉游戏站(GME。美国上市公司美国)4月14日宣布,由于首席执行官乔治·雪曼未能实现业绩目标,公司没收了约58...
十大券商一周策略:吃市酝酿中,后市成长股配置价值再现
中信证券:建议积极调整仓位,关注工业板块a股平静期投资者行为对主辅角色转换的约束将逐步缓解,国内经济开局良好,政治局会议有望稳定...
97家创业板公司宣布,文股份在第三季度财报中暂时高居盈利榜榜首
两市第三季度业绩报告的发布已经开始,更多的公司选择了业绩预测的方式来描述前三季度的经营状况,让投资者对前三季度的经营状况有一个大...
广东发展战略:医保谈判下滑减缓,指数上升。个股为什么会波动
市场表现今天,主要股指全天在狭窄的范围内波动。截至收盘,上证综指上涨0.02%,收于3397.29点,深成指上涨0.19%,收于...
央行推出200亿元7天逆回购操作,净收益1400亿元
原标题:央行推出200亿元7天逆回购操作,净收益1400亿元央行1月4日宣布,为了保持银行体系合理充裕的流动性,央行今天以利率竞...

友情链接