文本编辑器打开大(巨型,巨大,大)文本文件

 ̄綄美尐妖づ 提交于 2019-12-13 13:44:09

【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>>

我的意思是100+ MB大; 这样的文本文件可以推挤编辑人员的范围。

我需要浏览一个大的XML文件,但是如果编辑器有错误,则无法浏览。

有什么建议么?


#1楼

技巧和窍门

为什么要使用编辑器查看 (大)文件?

在* nix或Cygwin下 ,只需减少使用量即可 。 (有句名言“少即是多,或多或少”,因为“少”代替了以前的Unix命令“更多”,另外还可以向上滚动。)在“少”下搜索和导航类似于Vim,但是没有交换文件和很少的RAM。

GNU的Win32端口更少。 请参阅上面答案的“较少”部分。

佩尔

Perl适用于快速脚本,它的.. (范围触发器)运算符提供了一种很好的选择机制,以限制您必须经历的工作。

例如:

$ perl -n -e 'print if ( 1000000 .. 2000000)' humongo.txt | less

这将提取从1百万行到2百万行的所有内容,并允许您以更少的成本手动筛选输出。

另一个例子:

$ perl -n -e 'print if ( /regex one/ .. /regex two/)' humongo.txt | less

当“正则表达式一”找到某些内容时,此操作开始打印,而当“正则表达式二”找到有趣的块的末尾时,此操作停止。 它可能会找到多个块。 筛选输出...

日志解析器

这是您可以使用的另一个有用的工具。 引用维基百科的文章

logparser是一种灵活的命令行实用程序,最初由Microsoft员工Gabriele Giuseppini编写,用于自动化IIS日志记录的测试。 它旨在用于Windows操作系统,并且包含在IIS 6.0资源工具包工具中。 logparser的默认行为类似于“数据处理管道”,方法是在命令行上获取SQL表达式,然后输出包含与该SQL表达式匹配的行。

Microsoft将Logparser描述为功能强大的多功能工具,它提供对基于文本的数据(例如日志文件,XML文件和CSV文件)以及Windows操作系统上的关键数据源(例如事件日志,注册表,文件系统和Active Directory。 输入查询的结果可以在基于文本的输出中自定义格式,或者可以持久保存到SQL,SYSLOG或图表等更特殊的目标。

用法示例:

C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line > 1000 and line < 2000"
C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line like '%pattern%'"

尺寸的相对性

100 MB不太大。 3 GB越来越大。 我曾经在打印和邮件设施工作,该设施创造了美国一流邮件的2%。 我担任技术负责人的系统之一占邮件总数的15%以上。 我们到处都有一些大文件要调试。

和更多...

请随时在此处添加更多工具和信息。 这个答案是社区Wiki的一个原因! 我们都需要更多有关处理大量数据的建议...


#2楼

VS Code (Windows,macOS,Linux)-具有漂亮GUI的免费和开放源代码。 编辑了一个3.6 GB的JSON文件,只需一分钟即可加载。 您必须有足够的RAM才能加载文件。

免费的只读查看器:

  • glogg (Windows,macOS,Linux)–已确认可处理多GB文件。 它的主要功能是正则表达式搜索。 具有选项卡,可以直接从磁盘读取文件,可以监视/关注文件,并允许用户标记行。
  • LogExpert (Windows)–“ GUI替代tail 。” 支持文件跟踪,搜索,过滤,可配置的突出显示,插件和外部工具。
  • 大文本文件查看器 (Windows)–极简主义,可执行文件很小。 支持拆分视图,文本主题自定义,正则表达式搜索和文件关注。
  • Lister (Windows)–更加小巧和简约。 它是一个可执行文件,只有500 KB,但仍支持搜索(使用正则表达式),打印,十六进制编辑器模式和设置。
  • loxx (Windows)–支持以下,突出显示,行号,大文件,正则表达式,多个文件和视图等等。 免费版本有一些限制。

免费编辑:

  • VimEmacs (Windows,macOS,Linux)–经典Unix编辑器。 学习曲线陡峭,但效率很高。 它们的设置可以调整以使其更快。
  • 大型文件编辑器 (Windows)–打开和编辑TB +文件,支持Unicode,使用很少的内存,具有XML特定的功能,并包括二进制模式。
  • HxD (Windows)–十六进制编辑器,而不是文本编辑器; 但是它非常快而且有用。
  • GigaEdit (Windows)–支持搜索,字符统计和字体自定义。 但这是有问题的–对于大文件,它仅允许覆盖字符,而不能插入字符; 它不将LF视为行终止符,而仅将CRLF视为行终止符。 而且很慢

内置程序(无需安装):

  • less (macOS,Linux)–传统的Unix命令行传呼工具。 使您可以查看几乎任何大小的文本文件。 也可以安装在Windows上。
  • 记事本 (Windows)–较大的文件比较合适,尤其是在自动换行功能关闭的情况下。
  • MORE (Windows)–这是指Windows MORE ,而不是Unix more 。 一个控制台程序,使您可以一次查看一个屏幕的文件。

网络浏览器:

  • htmlpen.com –可以打开和语法突出显示TB +文件。 允许编辑,但非常大的文件除外。 支持搜索,正则表达式和导出。
  • readfileonline.com –另一个HTML5大文件查看器。 支持搜索。

付费编辑:

  • 010编辑器 (Windows,macOS,Linux)–打开巨大的文件(多达50 GB)。
  • SlickEdit (Windows,macOS,Linux)–打开大文件。
  • UltraEdit (Windows,macOS,Linux)–打开大于6 GB的文件,但必须对其进行更改才能使其实用:菜单»高级»配置»文件处理»临时文件»打开不带临时文件的文件...
  • EmEditor (Windows)–很好地处理非常大的文本文件(官方最多可处理248 GB,但根据一份报告则可处理多达900 GB)。

最后,您是否尝试过使用常规编辑器打开大文件? 一些编辑器实际上可以处理相当大的文件。 特别是, Notepad ++ (Windows)和Sublime Text (Windows,macOS,Linux)支持2 GB范围内的文件。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!