Чтение файлов Excel из C#
есть ли бесплатная библиотека с открытым исходным кодом для чтения файлов Excel (.xls) непосредственно из программы c#?
Не нужно быть слишком причудливым, просто выберите рабочий лист и прочитайте данные в виде строк. До сих пор я использовал функцию экспорта в текст Unicode Excel и анализ полученного файла (с разделителями табуляции), но я хотел бы исключить ручной шаг.
30 ответов
var fileName = string.Format("{0}\fileNameHere", Directory.GetCurrentDirectory());
var connectionString = string.Format("Provider=Microsoft.Jet.OLEDB.4.0; data source={0}; Extended Properties=Excel 8.0;", fileName);
var adapter = new OleDbDataAdapter("SELECT * FROM [workSheetNameHere$]", connectionString);
var ds = new DataSet();
adapter.Fill(ds, "anyNameHere");
DataTable data = ds.Tables["anyNameHere"];
Это то, что я обычно использую. Это немного отличается, потому что я обычно вставляю AsEnumerable () при редактировании таблиц:
var data = ds.Tables["anyNameHere"].AsEnumerable();
поскольку это позволяет мне использовать LINQ для поиска и построения структур из полей.
var query = data.Where(x => x.Field<string>("phoneNumber") != string.Empty).Select(x =>
new MyContact
{
firstName= x.Field<string>("First Name"),
lastName = x.Field<string>("Last Name"),
phoneNumber =x.Field<string>("Phone Number"),
});
Если это просто данные, содержащиеся в файле Excel, вы можете прочитать данные через ADO.NET - ... См. строки подключения, перечисленные здесь:
http://www.connectionstrings.com/?carrier=excel2007 или http://www.connectionstrings.com/?carrier=excel
-Райан
Update: тогда вы можете просто прочитать рабочий лист через что-то вроде select * from [Sheet1$]
ADO.NET подход быстрый и простой, но у него есть несколько причуд, о которых вы должны знать, особенно в отношении того, как обрабатываются типы данных.
эта превосходная статья поможет вам избежать некоторых распространенных ошибок: http://blog.lab49.com/archives/196
Это то, что я использовал для Excel 2003:
Dictionary<string, string> props = new Dictionary<string, string>();
props["Provider"] = "Microsoft.Jet.OLEDB.4.0";
props["Data Source"] = repFile;
props["Extended Properties"] = "Excel 8.0";
StringBuilder sb = new StringBuilder();
foreach (KeyValuePair<string, string> prop in props)
{
sb.Append(prop.Key);
sb.Append('=');
sb.Append(prop.Value);
sb.Append(';');
}
string properties = sb.ToString();
using (OleDbConnection conn = new OleDbConnection(properties))
{
conn.Open();
DataSet ds = new DataSet();
string columns = String.Join(",", columnNames.ToArray());
using (OleDbDataAdapter da = new OleDbDataAdapter(
"SELECT " + columns + " FROM [" + worksheet + "$]", conn))
{
DataTable dt = new DataTable(tableName);
da.Fill(dt);
ds.Tables.Add(dt);
}
}
Как насчет Excel Data Reader?
http://exceldatareader.codeplex.com/
Я использовал в нем гнев, в производственной среде, чтобы вытащить большие объемы данных из различных файлов Excel в SQL Server Compact. Он работает очень хорошо и довольно прочно.
вот код, который я написал на C#, используя .NET 1.1 несколько лет назад. Не уверен, что это будет именно то, что вам нужно (и, возможно, не мой лучший код :)).
using System;
using System.Data;
using System.Data.OleDb;
namespace ExportExcelToAccess
{
/// <summary>
/// Summary description for ExcelHelper.
/// </summary>
public sealed class ExcelHelper
{
private const string CONNECTION_STRING = "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=<FILENAME>;Extended Properties=\"Excel 8.0;HDR=Yes;\";";
public static DataTable GetDataTableFromExcelFile(string fullFileName, ref string sheetName)
{
OleDbConnection objConnection = new OleDbConnection();
objConnection = new OleDbConnection(CONNECTION_STRING.Replace("<FILENAME>", fullFileName));
DataSet dsImport = new DataSet();
try
{
objConnection.Open();
DataTable dtSchema = objConnection.GetOleDbSchemaTable(OleDbSchemaGuid.Tables, null);
if( (null == dtSchema) || ( dtSchema.Rows.Count <= 0 ) )
{
//raise exception if needed
}
if( (null != sheetName) && (0 != sheetName.Length))
{
if( !CheckIfSheetNameExists(sheetName, dtSchema) )
{
//raise exception if needed
}
}
else
{
//Reading the first sheet name from the Excel file.
sheetName = dtSchema.Rows[0]["TABLE_NAME"].ToString();
}
new OleDbDataAdapter("SELECT * FROM [" + sheetName + "]", objConnection ).Fill(dsImport);
}
catch (Exception)
{
//raise exception if needed
}
finally
{
// Clean up.
if(objConnection != null)
{
objConnection.Close();
objConnection.Dispose();
}
}
return dsImport.Tables[0];
#region Commented code for importing data from CSV file.
// string strConnectionString = "Provider=Microsoft.Jet.OLEDB.4.0;" +"Data Source=" + System.IO.Path.GetDirectoryName(fullFileName) +";" +"Extended Properties=\"Text;HDR=YES;FMT=Delimited\"";
//
// System.Data.OleDb.OleDbConnection conText = new System.Data.OleDb.OleDbConnection(strConnectionString);
// new System.Data.OleDb.OleDbDataAdapter("SELECT * FROM " + System.IO.Path.GetFileName(fullFileName).Replace(".", "#"), conText).Fill(dsImport);
// return dsImport.Tables[0];
#endregion
}
/// <summary>
/// This method checks if the user entered sheetName exists in the Schema Table
/// </summary>
/// <param name="sheetName">Sheet name to be verified</param>
/// <param name="dtSchema">schema table </param>
private static bool CheckIfSheetNameExists(string sheetName, DataTable dtSchema)
{
foreach(DataRow dataRow in dtSchema.Rows)
{
if( sheetName == dataRow["TABLE_NAME"].ToString() )
{
return true;
}
}
return false;
}
}
}
Koogra-это компонент с открытым исходным кодом, написанный на C#, который читает и пишет файлы Excel.
а ты конкретно спроси .xls, подразумевая более старые форматы файлов, для форматов OpenXML (например, xlsx) я настоятельно рекомендую OpenXML SDK (http://msdn.microsoft.com/en-us/library/bb448854.aspx)
некоторое время назад я много читал из файлов Excel на C#, и мы использовали два подхода:
- COM API, где вы получаете доступ к объектам Excel напрямую и манипулировать ими с помощью методов и свойств
- драйвер ODBC, который позволяет использовать Excel как базу данных.
последний подход был много быстрее: чтение большой таблицы с 20 столбцами и 200 строками займет 30 секунд через COM и полсекунды через ODBC. Так Что Я ... порекомендовал бы подход к базе данных, если все, что вам нужно, это данные.
спасибо,
Карл
ExcelMapper-это инструмент с открытым исходным кодом (http://code.google.com/p/excelmapper/), которые можно использовать для чтения листов Excel Как строго типизированных объектов. Он поддерживает форматы xls и xlsx.
Я хочу показать простой метод для чтения файла xls /xlsx.Сеть. Я надеюсь, что следующее будет полезным для вас.
private DataTable ReadExcelToTable(string path) { //Connection String string connstring = "Provider=Microsoft.ACE.OLEDB.12.0;Data Source=" + path + ";Extended Properties='Excel 8.0;HDR=NO;IMEX=1';"; //the same name //string connstring = Provider=Microsoft.JET.OLEDB.4.0;Data Source=" + path + //";Extended Properties='Excel 8.0;HDR=NO;IMEX=1';"; using(OleDbConnection conn = new OleDbConnection(connstring)) { conn.Open(); //Get All Sheets Name DataTable sheetsName = conn.GetOleDbSchemaTable(OleDbSchemaGuid.Tables,new object[]{null,null,null,"Table"}); //Get the First Sheet Name string firstSheetName = sheetsName.Rows[0][2].ToString(); //Query String string sql = string.Format("SELECT * FROM [{0}]",firstSheetName); OleDbDataAdapter ada =new OleDbDataAdapter(sql,connstring); DataSet set = new DataSet(); ada.Fill(set); return set.Tables[0]; } }
код из статьи: http://www.c-sharpcorner.com/uploadfile/d2dcfc/read-excel-file-with-net/. Вы можете получить более подробную информацию от него.
не бесплатно, но с последним офисом есть очень хорошая автоматизация .Net API. (в течение долгого времени был API, но был неприятным COM) вы можете делать все, что хотите / нужно в коде, пока приложение Office остается скрытым фоновым процессом.
Простите меня, если я здесь не на базе, но разве это не то, что офис Пиа для?
в последнее время, частично, чтобы стать лучше в LINQ.... Я использую API автоматизации Excel для сохранения файла в виде таблицы XML, а затем обрабатываю этот файл с помощью LINQ to XML.
SpreadsheetGear для .NET является компонентом электронной таблицы, совместимым с Excel .Сеть. Вы можете увидеть, что наши клиенты говорят о производительности с правой стороны нашего страница продукта. Вы можете попробовать себя бесплатную полнофункциональную оценка.
SmartXLS является еще одним компонентом электронной таблицы excel, который поддерживает большинство функций диаграмм excel, движков формул и может читать/писать формат excel2007 openxml.
компонент .NET Excel Reader .NET может удовлетворить ваши требования. Это достаточно хорошо для чтения файлов XLSX и XLS. Так что попробуйте:
Я рекомендую библиотеку FileHelpers, которая является бесплатной и простой в использовании библиотекой .NET для импорта / экспорта данных из EXCEL, фиксированной длины или разделенных записей в файлах, строках или потоках + больше.
Раздел Документации Excel Data Link http://filehelpers.sourceforge.net/example_exceldatalink.html
вы можете попробовать использовать это решение с открытым исходным кодом, что делает работу с Excel намного чище.
SpreadsheetGear является удивительным. Да, это расходы,но по сравнению с этими другими решениями это стоит того. Это быстро, надежно, очень всесторонне, и я должен сказать, что после использования этого продукта в моей полной программной работе более полутора лет, их поддержка клиентов фантастическая!
решение, которое мы использовали, необходимо, чтобы:
- разрешить Читать/Писать из Excel производимых файлов
- быть быстро в производительности (не так, как с помощью COMs)
- быть MS Office независимая (необходимо использовать без клиентов с установленным MS Office)
- быть свободный или Открыть Источник (но активно развивается)
есть несколько вариантов, но мы нашли NPoi (.NET-порт давно существующего Java Poi проект с открытым исходным кодом), чтобы быть лучшим: http://npoi.codeplex.com/
Она также позволяет работать с .док и. ppt-формат файла
Если это просто табличные данные. Я бы рекомендовал файл data helpers by Marcos Melli который можно скачать здесь.
вы можете написать электронную таблицу excel, которая загружает данную электронную таблицу excel и сохраняет ее как csv (а не делает это вручную).
тогда вы можете автоматизировать это с c#.
и как только его в csv, программа c# может grok это.
(кроме того, если кто-то просит вас программировать в excel, лучше притвориться, что вы не знаете, как)
(edit: Ах да, Роб и Райан оба правы)
Я знаю, что люди делают "расширение" Excel для этой цели.
Вы более или менее делаете кнопку в Excel с надписью "экспорт в программу X", а затем экспортируете и отправляете данные в формате, который программа может прочитать.
http://msdn.microsoft.com/en-us/library/ms186213.aspx должно быть хорошим местом для начала.
удачи
просто сделал быстрый демо-проект, который требовал управления некоторыми файлами excel. Компонент .NET от программного обеспечения GemBox был адекватен моим потребностям. Он имеет бесплатную версию с некоторыми ограничениями.
Пакет Excel является компонентом с открытым исходным кодом (GPL) для чтения/записи файлов Excel 2007. Я использовал его в небольшом проекте,и API прост. Работает только с XLSX (Excel 200&), а не с XLS.
исходный код также кажется хорошо организованным и легко обойти (если вам нужно расширить функциональность или исправить незначительные проблемы, как я сделал).
сначала я попробовал ADO.Net (строка подключения Excel) подход, но он был чреват неприятными хак - для если второй строка содержит число, она будет возвращать ints для всех полей в столбце ниже и тихо отбрасывать любые данные, которые не подходят.
мы используем:ClosedXML в довольно больших системах.
- свободный
- простота установки
- прямое кодирование
- очень отзывчивая поддержка
- команда разработчиков составляет очень открыты для новых предложений. Часто новые функции и исправления ошибок, реализованные в течение одной недели
Take.io
электронная таблица сделает эту работу за вас, и бесплатно. Просто взгляните на этой.
Я просто использовать ExcelLibrary загрузить .таблица xls в набор данных. Отлично сработало.