TensorFlow2.0(六):Dataset
/*--> */ /*--> */ /*--> */ /*--> */ /*--> */ /*--> */ 在整个机器学习过程中,除了训练模型外,应该就属数据预处理过程消耗的精力最多,数据预处理过程需要完成的任务包括数据读取、过滤、转换等等。为了将用户从繁杂的预处理操作中解放处理,更多地将精力放在算法建模上,TensorFlow中提供了data模块,这一模块以多种方式提供了数据读取、数据处理、数据保存等功能。本文重点是data模块中的Dataset对象。 1 创建 ¶ 对于创建Dataset对象,官方文档中总结为两种方式,我将这两种方式细化后总结为4中方式: (1)通过Dataset中的range()方法创建包含一定序列的Dataset对象。 range() range()方法是Dataset内部定义的一个的静态方法,可以直接通过类名调用。另外,Dataset中的range()方法与Python本身内置的range()方法接受参数形式是一致的,可以接受range(begin)、range(begin, end)、range(begin, end, step)等多种方式传参。 In [1]: import tensorflow as tf import numpy as np In [2]: dataset1 = tf.data.Dataset.range(5) type