Передача аргументов командной строки в argv в jupyter/ipython notebook
Мне интересно, можно ли заполнить sys.argv
(или некоторую другую структуру) аргументами командной строки в ноутбуке jupyter/ipython, аналогично тому, как это делается через python script.
Например, если я должен был запустить python script следующим образом:
python test.py False
Тогда sys.argv
будет содержать аргумент False
. Но если я запускаю jupyter notebook аналогичным образом:
jupyter notebook test.ipynb False
Затем аргумент командной строки теряется. Есть ли способ получить доступ к этому аргументу из самой записной книжки?
Ответы
Ответ 1
После многих оглядевшихся я нашел очень громоздкие пользовательские библиотеки, но решил это с несколькими строками кода, которые, как я думал, были довольно гладкими. Я использовал nbconvert для вывода html-отчета как вывода, который содержит всю графику и уценку из ноутбука, но принимает параметры командной строки, как всегда, через минимальную оболочку python:
Файл python test_args.py(который принимает параметры командной строки как обычно):
import sys,os
IPYNB_FILENAME = 'test_argv.ipynb'
CONFIG_FILENAME = '.config_ipynb'
def main(argv):
with open(CONFIG_FILENAME,'w') as f:
f.write(' '.join(argv))
os.system('jupyter nbconvert --execute {:s} --to html'.format(IPYNB_FILENAME))
return None
if __name__ == '__main__':
main(sys.argv)
В записной книжке содержится:
import sys,os,argparse
from IPython.display import HTML
CONFIG_FILE = '.config_ipynb'
if os.path.isfile(CONFIG_FILE):
with open(CONFIG_FILE) as f:
sys.argv = f.read().split()
else:
sys.argv = ['test_args.py', 'input_file', '--int_param', '12']
parser = argparse.ArgumentParser()
parser.add_argument("input_file",help="Input image, directory, or npy.")
parser.add_argument("--int_param", type=int, default=4, help="an optional integer parameter.")
args = parser.parse_args()
p = args.int_param
print(args.input_file,p)
и я могу запустить python-блокнот с аргументами, как обычно:
python test_args.py my_input_file --int_param 12
Я стараюсь вставлять блок с вызовами argparse в оболочку python, чтобы ошибки командной строки были пойманы python script и -h правильно.
Ответ 2
Я думаю, что этот Gist может вам помочь: https://gist.github.com/gbishop/acf40b86a9bca2d571fa
Это попытка простого парсера аргументов для большинства пар ключ = значение, которые могут использоваться как в командной строке, так и в ноутбуках IPython. Он поддерживает параметры запроса в URL-адресах ноутбуков и команду "Выполнить" для ноутбуков.
Ответ 3
Я нашел два проекта, которые делают то, что вы просите
- Papermill, добавит ячейку в вашу записную книжку с аргументами, которые вы передадите ей в командной строке. Так что это довольно просто, вы определяете свои значения по умолчанию в первой ячейке (тег должен иметь
parameters
) - nbparameterise это похожая концепция, но вы не помечаете свою ячейку значениями по умолчанию, она должна быть первой.
Вот хороший ресурс для обсуждения этой проблемы: https://github.com/jupyter/help/issues/218
Ответ 4
Если вы используете iPython для тестирования, преобразование argparse в формат класса может быть быстрым фиктивным решением, подобным этому.
class Args:
data = './data/penn'
model = 'LSTM'
emsize = 200
nhid = 200
args=Args()
Github страница предлагает сервис веб-трансформации. http://35.192.144.192:8000/arg2cls.html
Надеюсь, что это будет полезно для вашего тестирования. 9/19 января многие ошибки исправлены.
Преобразуйте модуль argparse в формат класса. Python3 требуется.
python3 [arg2cls.py] [argparse_script.py]
затем скопируйте и вставьте формат класса для замены функций argparse.
#!/usr/bin/env python3
from collections import OrderedDict
import sys
import re
DBG = False
#add_argument(), set_defaults() only available.
ListStartPatt = re.compile(r'\s*\[.*')
ListStartPatt2 = re.compile(r'\).*\[.*') # list out of function scope.
ListPatt = re.compile(r'(\[.*?\])')
GbgPatt = re.compile(r'(.*?)\)[^\)]+') # for float('inf') cmplx.
GbgPatt2 = re.compile(r'(.*?)\).*') # general gbg, ? for non greedy.
LpRegex = re.compile(r'\({1,}\s{0,}')
RpRegex = re.compile(r'\s{0,}\){1,}')
PrRegex = re.compile(r'\((.*)(\))(?!.*\))') # from \( to last \).
CmRegex = re.compile(r'\s{0,},\s{0,}')
StrRegex = re.compile(r'\'(.*?)\'')
# Argument dict : {arg_name : value}
argDct=OrderedDict()
# process 'default=' value.
def default_value(tval, dtype=''):
# string pattern.
regres = StrRegex.match(tval)
if regres and not re.search('int|float|long|bool|complex', dtype):
if DBG:
print('default_value: str patt found')
tval = regres.group(0)
return tval
# typed pattern.
CommaSeparated = CmRegex.split(tval)[0]
if DBG:
print('comma sepearated value:', CommaSeparated)
if ListStartPatt.match(CommaSeparated) and not ListStartPatt2.match(CommaSeparated):
lres = ListPatt.search(tval)
if lres:
tval = lres.group(1)
if DBG:
print('list patt exist tval: ', tval)
else :
tval = CmRegex.split(tval)[0]
if DBG:
print('no list format tval: ', tval)
# if default value is not like - int('inf') , remove characters after ')' garbage chars.
ires = RpRegex.split(tval)[0]
if not (re.search('int|float|long|bool|complex', ires) and re.search(r'[a-z]+\(',ires)):
if DBG:
print('not int("inf") format. Rp removed tval : ', tval)
tval = re.split(r'\s{0,}\){1,}',tval)[0]
gbg = GbgPatt2.search(tval)
if gbg:
tval = gbg.group(1)
if DBG:
print('garbage exist & removed. tval : ', tval)
# int('inf') patt.
else:
if DBG:
print('type("inf") value garbaging!')
gbg = GbgPatt.search(tval)
if gbg:
if DBG:
print('garbage found, extract!')
tval = gbg.group(1)
return tval
# Handling add_argument()
def add_argument(arg_line):
global argDct
if DBG:
print('\nin add_argument : **Pre regex: ', arg_line)
'''
argument name
'''
# argname = DdRegex.split(arg_line)[1] # Dash or regex for arg name.
argname = re.search('\'--(.*?)\'', arg_line)
if not argname:
argname = re.search('\'-+(.*?)\'', arg_line)
# dest= keyword handling.
dest = re.search(r',\s*dest\s*=(.*)', arg_line)
if dest:
dval = dest.group(1)
dval = default_value(dval)
argname = StrRegex.search(dval)
# hyphen(-) to underscore(_)
if argname:
argname = argname.group(1).replace('-', '_')
else :
# naive str argname.
sres = StrRegex.match(arg_line)
if sres:
argname = sres.group(1)
if not argname:
return # no argument name
'''
check for syntaxes (type=, default=, required=, action=, help=, choices=)
'''
dtype = ''
dres = re.search(r',\s*type\s*=\s*(.*)', arg_line)
if dres:
dtype = dres.group(1)
dtype = CmRegex.split(dtype)[0]
dfult = re.search(r',\s*default\s*=\s*(.*)', arg_line)
rquird = re.search(r',\s*required\s*=\s*(.*)', arg_line)
action = re.search(r',\s*action\s*=\s*(.*)', arg_line)
hlp = re.search(r',\s*help\s*=\s*(.*)', arg_line)
chice = re.search(r',\s*choices\s*=\s*(.*)', arg_line)
# help message
hlp_msg = ''
if hlp:
thl = hlp.group(1)
hlp_msg = default_value(thl)
if hlp_msg:
hlp_msg = 'help='+hlp_msg
# choice message
choice_msg = ''
if chice:
tch = chice.group(1)
choice_msg = default_value(tch)
if choice_msg:
choice_msg = 'choices='+choice_msg+' '
'''
argument value
'''
# tval: argument value.
tval = ''
# default exist.
if dfult:
tval = dfult.group(1)
tval = default_value(tval, dtype)
if DBG:
print('value determined : ', tval)
# action or required syntaxes exist.
elif action or rquird:
if DBG:
print('in action/required handling')
msg_str = ''
if action:
tval = action.group(1)
msg_str = 'action'
elif rquird:
tval = rquird.group(1)
msg_str = 'required'
tval = default_value(tval)
tval = ' ** ' + msg_str + ' '+tval+'; '+choice_msg+ hlp_msg
# no default, action, required.
else :
argDct[argname] = ' ** default not found; '+choice_msg+ hlp_msg
# value found.
if tval:
argDct[argname] = tval
# Handling set_defaults()
def set_defaults(arg_line):
global argDct
if DBG:
print('\nin set_defaults arg_line: ', arg_line)
# arguments to process.
tv=''
# arguments of set_default()
SetPatt = re.compile(r'(.+=.+\)?)')
sres = SetPatt.search(arg_line)
if sres:
tv = sres.group(1)
tv = tv.split(')')[0].replace(' ', '')
if DBG:
print('\nset_default values: ', tv)
# one arguemnt regex.
SetArgPatt = re.compile(r'([^=]+=[^=,]+,?)')
# handling multiple set_default() arguments. (may have a bug)
while True:
if DBG:
print('remaining : ', tv)
nres = SetArgPatt.match(tv)
if nres:
tnv = nres.group(1)
if DBG:
print(tnv)
# white space already removed.
tname = tnv.split('=', 1)[0]
tval = tnv.split('=', 1)[1]
# list pattern in value. ([1, ...)
lres = ListStartPatt.match(tval)
if lres:
if DBG:
print('set_default: List patt found!')
# concat whole line and find complete list pattern.
tval+= tv.split(tnv)[1]
tval = ListPatt.match(tval)
if tval:
tval = tval.group(1)
# update spliter.
tnv = tname+'='+tval+','
# not list format.
else :
tval = default_value(tval)
if DBG:
print('#set_default determined! %s: %s\n' %(tname, tval))
print('spliter: ',tnv)
argDct[tname] = tval
# split with processed argument.
tv = tv.split(tnv)
if len(tv) > 1:
tv = tv[1]
else:
break
else:
break
# Remove empty line & Concatenate line-separated syntax.
def preprocess(fname):
try :
with open(fname, 'r', encoding='UTF8') as f:
txt = f.read()
t = txt.splitlines(True)
t = list( filter(None, t) )
# remove empty line
t = [x for x in t if not re.match(r'\s{0,}\n',x)]
# concatenate multiple lined arguments.
# empl : lines to be deleted from t[].
empl = []
for i in range(len(t)-1, 0, -1):
if not re.search('add_argument|set_defaults', t[i]):
t[i-1] += t[i]
t[i-1]=re.sub(r'\n{0,}','',t[i-1])
t[i-1]=re.sub(r'\s{1,}',' ',t[i-1])
empl.append(t[i])
for d in empl:
t.remove(d)
for i, line in enumerate(t):
t[i] = line.replace('\"', '\'').split('parse_args()')[0]
return t
except IOError:
print('IOError : no such file.', fname)
sys.exit()
def transform(fname):
# t : list() contains add_argument|set_defaults lines.
arg_line_list = preprocess(fname)
for i, arg_line in enumerate(arg_line_list):
t = PrRegex.search(arg_line)
if t:
t = t.group(1) # t: content of add_argument Parentheses.
else :
continue # nothing to parse.
if re.search(r'add_argument\s*\(', arg_line):
add_argument(t)
elif re.search(r'set_defaults\s*\(',arg_line):
set_defaults(t)
else :
# Nothing to parse.
continue
print('\nclass Args:')
for i in argDct:
print(' ',i, '=', argDct[i])
print()
print('args=Args()')
def main():
if len(sys.argv) <2:
print('Usage : python arg2cls.py [target.py] [target2.py(optional)] ...')
sys.exit(0)
sys.argv.pop(0)
#handling multiple file input.
for fname in sys.argv:
transform(fname)
if(__name__ == "__main__"):
main()
Ответ 5
sys.argv
выдает list
, поэтому я использовал
sys.argv.append('hello')
в блокноте Jupyter, который позволял мне добавлять дополнительные члены и делать вид, будто я передаю аргументы из командной строки.
Ответ 6
вы можете использовать встроенную магическую команду Jupyter %run
внутри ноутбука.
Из этой ссылка вы можете использовать:
%run -p [prof_opts] filename.py [args to program]
Или что-то вроде %run -i script.py False
Или, если вы разбираете аргументы %run -i script.py --flag1 False --flag2 True