Pytables h5py
Anthony Scopatz,南卡罗来纳大学助理教授,HDF客座博主 “Python 很棒,它的科学计算生态系统也是世界一流的。 HDF5 非常棒,是科学数据持久性的黄金标准。 许多人使用Python的HDF5,而这个数字只是由于 大熊猫的HDFStore 而增长 。 但是,使用Python的HDF5至少还有一个比它需要的结。 让我们改变它。“ 几乎在使用 Python的 HDF5时 ,您可以选择两个具有重叠功能的精彩软件包: h5py 和 PyTables 。 h5py使用自动生成的Cython更紧密地包装HDF5 API。 PyTables虽然也包装了HDF5,但更多地关注Table数据结构,并增加了复杂的索引和核心外查询。 您使用哪个包取决于您的使用案例 - 有时您真的需要两个! 在 SciPy 2015上 ,来自PyTables,h5py,HDF Group,pandas以及社区成员的开发人员坐下来讨论了如何使Python和HDF5的故事更精简和更易于维护。 以下是我们提出的建议: 重构PyTables依赖于h5py与HDF5的结合。 更新h5py以支持PyTables重构(需要一些数据类型等)。 PyTables将保留其所有高级抽象。 使h5py - PyTables交互无缝。 确保API和HDF5文件向后兼容h5py和PyTable。 PyTables的主要版本号