Парсинг CSV с помощью oledb на C#
Я знаю, что эта тема сделана до смерти, но я в тупике.
мне нужно разобрать csv. Это довольно средний CSV, и логика разбора была написана с помощью OleDB другим разработчиком, который поклялся, что он работает, прежде чем он уехал в отпуск :)
CSV sample:
Dispatch Date,Master Tape,Master Time Code,Material ID,Channel,Title,Version,Duration,Language,Producer,Edit Date,Packaging,1 st TX,Last TX,Usage,S&P Rating,Comments,Replace,Event TX Date,Alternate Title
,a,b,c,d,e,f,g,h,,i,,j,k,,l,m,,n,
проблема в том, что я получаю различные ошибки в зависимости от строки подключения, которую я пытаюсь.
когда я пробую строку подключения:
Provider=Microsoft.Jet.OLEDB.4.0;Data Source="D:TEST.csv";Extended Properties="text;HDR=No;FMT=Delimited"
Я получаю ошибка:
'D:TEST.csv' is not a valid path. Make sure that the path name is spelled correctly and that you are connected to the server on which the file resides.
когда я пробую строку подключения:
Provider=Microsoft.ACE.OLEDB.12.0;Data Source=D:TEST.csv;Extended Properties=Excel 12.0;
или строка подключения
Provider=Microsoft.Jet.OLEDB.4.0;Data Source=D:TEST.csv;Extended Properties=Excel 8.0;
Я получаю сообщение об ошибке:
External table is not in the expected format.
Я рассматриваю возможность выбросить весь код и начать с нуля. Есть ли что-то очевидное, что я делаю неправильно?
5 ответов
вы должны указать только имя каталога в строке подключения. Имя файла будет использоваться для запроса:
var filename = @"c:\work\test.csv";
var connString = string.Format(
@"Provider=Microsoft.Jet.OleDb.4.0; Data Source={0};Extended Properties=""Text;HDR=YES;FMT=Delimited""",
Path.GetDirectoryName(filename)
);
using (var conn = new OleDbConnection(connString))
{
conn.Open();
var query = "SELECT * FROM [" + Path.GetFileName(filename) + "]";
using (var adapter = new OleDbDataAdapter(query, conn))
{
var ds = new DataSet("CSV File");
adapter.Fill(ds);
}
}
и вместо OleDB вы можете использовать приличный парсер CSV (или еще один).
Кажется, что ваша первая строка содержит имена столбцов, поэтому вам нужно включить свойство HDR=YES, например:
Provider=Microsoft.ACE.OLEDB.12.0;Data Source=D:\TEST.csv;Extended Properties="Excel 12.0;HDR=YES";
попробуйте строку подключения:
"Provider=Microsoft.Jet.OLEDB.4.0;Data Source=D:\TEST.csv;Extended Properties=\"Excel 8.0;IMEX=1\""
var s=@"D:\TEST.csv";
string dir = Path.GetDirectoryName(s);
string sConnection = "Provider=Microsoft.Jet.OLEDB.4.0;"
+ "Data Source=\"" + dir + "\\";"
+ "Extended Properties=\"text;HDR=YES;FMT=Delimited\"";
альтернативное решение http://msdn.microsoft.com/en-us/library/x710fk43 (v=VS.100).aspx
таким образом, вам не придется полагаться на другого разработчика, который отправился в отпуск. Я использовал его так много раз и не попал ни в корягу.