Программа для работы с большими CSV-файлами [закрыто]
есть ли хорошие программы для чтения больших CSV-файлов? Некоторые из файлов данных, с которыми я имею дело, находятся в диапазоне 1 ГБ. У них слишком много строк для Excel, чтобы даже заниматься. Использование Access может быть немного медленным, так как вам нужно импортировать их в базу данных для работы с ними напрямую. Есть ли программа, которая может открыть большие файлы CSV и дать вам простой макет электронной таблицы, чтобы помочь вам легко и быстро сканировать данные?
7 ответов
MySQL может импортировать CSV-файлы очень быстро в таблицы, используя LOAD DATA INFILE
Я нашел reCSVeditor - отличная программа для редактирования больших файлов CSV. Идеально для обнажать вне ненужные колонки. Я использовал его для файлов 1,000,000 record files довольно легко.
вэдит идеально подходит для этого. Я обычно открываю 100 + meg (я знаю, что вы сказали до одного концерта, я думаю, что они рекламируют на своем сайте, он может обрабатывать в два раза больше) файлы с ним. Он имеет поддержку regex и множество других функций. 70 долларов дешево за сумму, которую вы можете сделать с ним.
GVim может обрабатывать файлы такого размера бесплатно, если вы не подключены к статическому представлению размера электронной таблицы.
ведит отлично, но не забывайте, что вы всегда можете вернуться к "основам" проверить Cygwin и начать greping.
Полезные команды
- глава
- хвост
- конечно perl!
Это зависит от того, что вы на самом деле хотите делать с данными. Учитывая большой текстовый файл, как это обычно требуется только меньшее подмножество данных в любой момент времени, поэтому не упускайте из виду такие инструменты, как "grep" для извлечения частей, которые вы хотите искать и работать.
Если вы можете поместить данные в память, и вам нравится python, я рекомендую проверить UniTable часть августа. (Отказ от ответственности: август с открытым исходным кодом (GPLv2), но я работаю в компании, которая его пишет.)
Это не очень хорошо документировано, но это должно помочь вам идти.
from augustus.kernel.unitable import *
a = UniTable().from_csv_file('filename')
b = a.subtbl(a['key'] == some_value) #creates a subtable
это не даст вам непосредственно excel, как интерфейс, но с небольшим количеством работы вы можете получить много статистики быстро.