如果在运行python脚本时需要传入一些参数,例如gpus
与batch_size
,可以使用如下三种方式。
python script.py 0,1,2 10 python script.py -gpus=0,1,2 --batch-size=10 python script.py -gpus=0,1,2 --batch_size=10
这三种格式对应不同的参数解析方式,分别为sys.argv
、argparse、
tf.app.run,
前两者是python自带的功能,后者是tensorflow
提供的便捷方式。
1.sys.argv
sys
模块是很常用的模块, 它封装了与python解释器相关的数据,例如sys.modules
里面有已经加载了的所有模块信息,sys.path
里面是PYTHONPATH
的内容,而sys.argv
则封装了传入的参数数据。使用
sys.argv
接收上面第一个命令中包含的参数方式如下:import sys gpus = sys.argv[1] #gpus = [int(gpus.split(','))] batch_size = sys.argv[2] print(gpus) print(batch_size)
2.argparse
import argparse parser = argparse.ArgumentParser(description='manual to this script') parser.add_argument("--gpus", type=str, default="0") parser.add_argument("--batch-size", type=int, default=32) args = parser.parse_args() print(args.gpus) print(args.batch_size)
需要注意的是,脚本运行命令
python script.py -gpus=0,1,2 --batch-size=10
中的--batch-size
会被自动解析成batch_size
.parser.add_argument
方法的type
参数理论上可以是任何合法的类型, 但有些参数传入格式比较麻烦,例如list,所以一般使用bool
, int
, str
, float
这些基本类型就行了,更复杂的需求可以通过str
传入,然后手动解析。bool
类型的解析比较特殊,传入任何值都会被解析成True
,传入空值时才为False
3.tf.app.run
import tensorflow as tf tf.app.flags.DEFINE_string('gpus', None, 'gpus to use') tf.app.flags.DEFINE_integer('batch_size', 5, 'batch size') FLAGS = tf.app.flags.FLAGS def main(_): print(FLAGS.gpus) print(FLAGS.batch_size) if __name__=="__main__": tf.app.run()
有几点需要注意:
tensorflow
只提供以下几种方法:
tf.app.flags.DEFINE_string
,
tf.app.flags.DEFINE_integer
,
tf.app.flags.DEFINE_boolean
,
tf.app.flags.DEFINE_float
四种方法,分别对应str
, int
,bool
,float
类型的参数。这里对bool
的解析比较严格,传入1会被解析成True
,其余任何值都会被解析成False
。
脚本中需要定义一个接收一个参数的main
方法:def main(_):
,这个传入的参数是脚本名,一般用不到, 所以用下划线接收。
以batch_size
参数为例,传入这个参数时使用的名称为--batch_size
,也就是说,中划线不会像在argparse
中一样被解析成下划线。
tf.app.run()
会寻找并执行入口脚本的main
方法。也只有在执行了tf.app.run()
之后才能从FLAGS
中取出参数。
从它的签名来看,它也是可以自己指定需要执行的方法的,不一定非得叫main
: