在 Jupyter 中重新导入特定的 Python 文件(场景分析)
作者:青南 发布时间:2021-01-30 01:16:57
Jupyter 是数据分析领域非常有名的开发环境,使用 Jupyter 写数据分析相关的代码会大大节约开发时间。
设想这样一个场景:别的部门的同事传给你一个数据分析的模块,用于实现对数据的高级分析。模块里面有上百个函数。
如果直接写 Python 文件来调用数据分析模块,那么使用方法非常简单:
from analyze import FathersAnalyzer
data = [...]
father = FathersAnalyzer(data)
result = father.analyze()
print(f'分析结果为:{result}')
现在,你需要使用 Jupyter 来调用这个分析模块。你应该怎么在 Jupyter里面调用?
你可能会觉得,这还不简单吗?直接把这个模块的代码与 Jupyter Notebook 的 .ipynb
文件放在一起,然后在 Jupyter 里面像导入普通模块那样导入即可,如下图所示:
那么现在问题来了,如果我此时修改了 analyze.py
文件,会出现什么情况呢?
我们改一下看看,如下图所示。
重新运行这个 Cell 中的代码,代码中虽然有 from analyze import FathersAnalyzer
,看起来像是重新导入了这个模块,但是运行却发现,它运行的是修改之前的代码。
这是因为,一个 Jupyter Notebook 中的所有代码,都是在同一个运行时中运行的代码,当你多次导入同一个模块时,Python 的包管理机制会自动忽略后面的导入,始终只使用第一次导入的结果(所以使用这种方式也可以实现单例模式)。
那么如果我在修改了被导入的包以后,想重新导入它怎么办呢?有3种方案:
importlib
但这种方案弊端也很明显——除非你按顺序运行每一个 Cell,否则,你的代码会变成下图这样:
在每一个 Cell 里面都需要 重新加载一次分析模块,否则,很有可能在你单独运行某一个 Cell 的时候,用的是老的代码,就会导致难以察觉的 bug。
使用 Jupyter 自带的 %autoreload
:
%load_ext autoreload
%autoreload 1
%aimport analyze
data = 123
importlib.reload(analyze)
father = analyze.FathersAnalyzer(data)
result = father.analyze()
print(result)
运行效果如下图所示:
其中关键的代码有三行:
%load_ext autoreload
%autoreload 1
%aimport analyze
这三行代码只有在 Jupyter 里面才能正常运行,在 普通的.py 文件里面这样写会报错。它们的作用是:第1行启动 autoreload
机制。第2行,设置自动加载通过 %aimport
导入的模块。第3行使用 %aimport
导入 analyze
模块。
这样写以后,任意一个 Cell 运行,所有被 %aimport
导入的模块都会被重新加载一次。从而让你每次都使用最新的代码。
当然,你还可以进一步偷懒,把特殊代码缩减为2行:
%load_ext autoreload
%autoreload 2
%autoreload
后面的参数被设置为2时,每次运行任意一个 Cell,都会自动重新加载所有 import xxx
导入的模块。这样做的代价是,运行会慢一些。
总结
以上所述是小编给大家介绍的在 Jupyter 中重新导入特定的 Python 文件的方法,希望对大家有所帮助!
来源:https://juejin.im/post/5db2b8b36fb9a02078054afa
猜你喜欢
- 目录1. 理解 * 和 ** 2.Python函数的参数 3. 支持任意参数的函数
- 1. 镜像源列表清华:https://pypi.tuna.tsinghua.edu.cn/simple阿里云:http://mirrors.
- 最近写一个和二维列表有关的算法时候发现的当用max求二维列表中最大值时,输出的结果是子列表首元素最大的那个列表测试如下c=[[1,2,-1]
- 如何要恢复Master数据库呢?方法1:重装SQL,但是数据就Over掉了方法2:重建Master Rebuildm.exe 用到SQL的安
- //1、运行到C盘根目录 //2、输入:SET ORACLE_SID = 你的SID名称 3、输入:sqlplus/nolog 4、输入:c
- 要使用request对象的ServerVariables属性,通过它来获得环境变量的值。使用的语法为:Request.ServerVaria
- 文本的排版依据语言的不同会有一些格式上的要求,比如简体中文中类似逗号、分号等标点符号不会出现在一行的开头,对于英文来讲就是一个完整单词不会在
- 给定一个字符串,要求在这个字符串中找到符合回文性质的最长子串。所谓回文性是指诸如 “aba”,"ababa","
- 简介最近在整理我们项目代码的时候,发现有很多活动的代码在结构和提供的功能上都非常相似。为了方便今后的开发,我花了一点时间编写了一个生成代码框
- 前言数据清洗是一项复杂且繁琐(kubi)的工作,同时也是整个数据分析过程中最为重要的环节。有人说一个分析项目80%的时间都是在清洗数据,这听
- 虽然有很多种方式可以解决这个问题,但是我们可以用T-SQL代码来处理这个文件删除过程。我用xp_cmdshell命令和FORFILES命令来
- JavaScript是一门OOP,而有些人说,JavaScript是基于对象的。1) 如何创建对象:1. 使用constructor,例如:
- 前段时间为准备百度面试恶补的东西,虽然最后还是被刷了,还是把那几天的“战利品”放点上来,算法一直是自己比较薄弱的地方,以后还要更加努力啊。下
- 在 CodeBit.cn 的论坛中,有人问 Javascript 中如何截取小数位并实现四舍五入,这是一个很常用的 js 技术,帖子中也有网
- 1,CSS,JS,IMG一个都不能少运行代码框<style type="text/css">&l
- 直接上代码了import smtplibmsg = MIMEMultipart()#构造附件1att1 = MIMEText(open(
- 一.条件语句条件语句可以给定一个判断条件,并在程序执行过程中判断该条件是否成立。程序根据判断结果,执行不同的操作,这样就可以改变代码的执行顺
- 如下所示:def is_img(ext): ext = ext.lower() if ext == '.jpg': &nbs
- 这是我使用python写的第一个类(也算是学习面向对象语言以来正式写的第一个解耦的类),记录下改进的过程。分析需求最初,因为使用time模块
- 前言地图定位这个功能大家都很熟悉吧,那微信小程序中要怎么实现地图定位呢,其实非常简单,没有大家想象中那么难,看完本篇文章,你也可以轻松实现这