Парсинг CSV с помощью oledb на C#

Я знаю, что эта тема сделана до смерти, но я в тупике.

мне нужно разобрать csv. Это довольно средний CSV, и логика разбора была написана с помощью OleDB другим разработчиком, который поклялся, что он работает, прежде чем он уехал в отпуск :)

CSV sample:
Dispatch Date,Master Tape,Master Time Code,Material ID,Channel,Title,Version,Duration,Language,Producer,Edit Date,Packaging,1 st TX,Last TX,Usage,S&P Rating,Comments,Replace,Event TX Date,Alternate Title
,a,b,c,d,e,f,g,h,,i,,j,k,,l,m,,n,

проблема в том, что я получаю различные ошибки в зависимости от строки подключения, которую я пытаюсь.

когда я пробую строку подключения:

Provider=Microsoft.Jet.OLEDB.4.0;Data Source="D:TEST.csv";Extended Properties="text;HDR=No;FMT=Delimited"

Я получаю ошибка:

'D:TEST.csv' is not a valid path.  Make sure that the path name is spelled correctly and that you are connected to the server on which the file resides.

когда я пробую строку подключения:

Provider=Microsoft.ACE.OLEDB.12.0;Data Source=D:TEST.csv;Extended Properties=Excel 12.0;

или строка подключения

Provider=Microsoft.Jet.OLEDB.4.0;Data Source=D:TEST.csv;Extended Properties=Excel 8.0;

Я получаю сообщение об ошибке:

External table is not in the expected format.

Я рассматриваю возможность выбросить весь код и начать с нуля. Есть ли что-то очевидное, что я делаю неправильно?

5 ответов


вы должны указать только имя каталога в строке подключения. Имя файла будет использоваться для запроса:

var filename = @"c:\work\test.csv";
var connString = string.Format(
    @"Provider=Microsoft.Jet.OleDb.4.0; Data Source={0};Extended Properties=""Text;HDR=YES;FMT=Delimited""", 
    Path.GetDirectoryName(filename)
);
using (var conn = new OleDbConnection(connString))
{
    conn.Open();
    var query = "SELECT * FROM [" + Path.GetFileName(filename) + "]";
    using (var adapter = new OleDbDataAdapter(query, conn))
    {
        var ds = new DataSet("CSV File");
        adapter.Fill(ds);
    }
}

и вместо OleDB вы можете использовать приличный парсер CSV (или еще один).


Кажется, что ваша первая строка содержит имена столбцов, поэтому вам нужно включить свойство HDR=YES, например:

Provider=Microsoft.ACE.OLEDB.12.0;Data Source=D:\TEST.csv;Extended Properties="Excel 12.0;HDR=YES";

попробуйте строку подключения:

"Provider=Microsoft.Jet.OLEDB.4.0;Data Source=D:\TEST.csv;Extended Properties=\"Excel 8.0;IMEX=1\""

 var  s=@"D:\TEST.csv";
 string dir = Path.GetDirectoryName(s);
 string sConnection = "Provider=Microsoft.Jet.OLEDB.4.0;"
                       + "Data Source=\"" + dir + "\\";"
                       + "Extended Properties=\"text;HDR=YES;FMT=Delimited\"";

альтернативное решение http://msdn.microsoft.com/en-us/library/x710fk43 (v=VS.100).aspx

таким образом, вам не придется полагаться на другого разработчика, который отправился в отпуск. Я использовал его так много раз и не попал ни в корягу.