Чтение файлов Excel из C#

есть ли бесплатная библиотека с открытым исходным кодом для чтения файлов Excel (.xls) непосредственно из программы c#?

Не нужно быть слишком причудливым, просто выберите рабочий лист и прочитайте данные в виде строк. До сих пор я использовал функцию экспорта в текст Unicode Excel и анализ полученного файла (с разделителями табуляции), но я хотел бы исключить ручной шаг.

30 ответов


var fileName = string.Format("{0}\fileNameHere", Directory.GetCurrentDirectory());
var connectionString = string.Format("Provider=Microsoft.Jet.OLEDB.4.0; data source={0}; Extended Properties=Excel 8.0;", fileName);

var adapter = new OleDbDataAdapter("SELECT * FROM [workSheetNameHere$]", connectionString);
var ds = new DataSet();

adapter.Fill(ds, "anyNameHere");

DataTable data = ds.Tables["anyNameHere"];

Это то, что я обычно использую. Это немного отличается, потому что я обычно вставляю AsEnumerable () при редактировании таблиц:

var data = ds.Tables["anyNameHere"].AsEnumerable();

поскольку это позволяет мне использовать LINQ для поиска и построения структур из полей.

var query = data.Where(x => x.Field<string>("phoneNumber") != string.Empty).Select(x =>
                new MyContact
                    {
                        firstName= x.Field<string>("First Name"),
                        lastName = x.Field<string>("Last Name"),
                        phoneNumber =x.Field<string>("Phone Number"),
                    });

Если это просто данные, содержащиеся в файле Excel, вы можете прочитать данные через ADO.NET - ... См. строки подключения, перечисленные здесь:

http://www.connectionstrings.com/?carrier=excel2007 или http://www.connectionstrings.com/?carrier=excel

-Райан

Update: тогда вы можете просто прочитать рабочий лист через что-то вроде select * from [Sheet1$]


ADO.NET подход быстрый и простой, но у него есть несколько причуд, о которых вы должны знать, особенно в отношении того, как обрабатываются типы данных.

эта превосходная статья поможет вам избежать некоторых распространенных ошибок: http://blog.lab49.com/archives/196


Это то, что я использовал для Excel 2003:

Dictionary<string, string> props = new Dictionary<string, string>();
props["Provider"] = "Microsoft.Jet.OLEDB.4.0";
props["Data Source"] = repFile;
props["Extended Properties"] = "Excel 8.0";

StringBuilder sb = new StringBuilder();
foreach (KeyValuePair<string, string> prop in props)
{
    sb.Append(prop.Key);
    sb.Append('=');
    sb.Append(prop.Value);
    sb.Append(';');
}
string properties = sb.ToString();

using (OleDbConnection conn = new OleDbConnection(properties))
{
    conn.Open();
    DataSet ds = new DataSet();
    string columns = String.Join(",", columnNames.ToArray());
    using (OleDbDataAdapter da = new OleDbDataAdapter(
        "SELECT " + columns + " FROM [" + worksheet + "$]", conn))
    {
        DataTable dt = new DataTable(tableName);
        da.Fill(dt);
        ds.Tables.Add(dt);
    }
}

Как насчет Excel Data Reader?

http://exceldatareader.codeplex.com/

Я использовал в нем гнев, в производственной среде, чтобы вытащить большие объемы данных из различных файлов Excel в SQL Server Compact. Он работает очень хорошо и довольно прочно.


вот код, который я написал на C#, используя .NET 1.1 несколько лет назад. Не уверен, что это будет именно то, что вам нужно (и, возможно, не мой лучший код :)).

using System;
using System.Data;
using System.Data.OleDb;

namespace ExportExcelToAccess
{
    /// <summary>
    /// Summary description for ExcelHelper.
    /// </summary>
    public sealed class ExcelHelper
    {
        private const string CONNECTION_STRING = "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=<FILENAME>;Extended Properties=\"Excel 8.0;HDR=Yes;\";";

        public static DataTable GetDataTableFromExcelFile(string fullFileName, ref string sheetName)
        {
            OleDbConnection objConnection = new OleDbConnection();
            objConnection = new OleDbConnection(CONNECTION_STRING.Replace("<FILENAME>", fullFileName));
            DataSet dsImport = new DataSet();

            try
            {
                objConnection.Open();

                DataTable dtSchema = objConnection.GetOleDbSchemaTable(OleDbSchemaGuid.Tables, null);

                if( (null == dtSchema) || ( dtSchema.Rows.Count <= 0 ) )
                {
                    //raise exception if needed
                }

                if( (null != sheetName) && (0 != sheetName.Length))
                {
                    if( !CheckIfSheetNameExists(sheetName, dtSchema) )
                    {
                        //raise exception if needed
                    }
                }
                else
                {
                    //Reading the first sheet name from the Excel file.
                    sheetName = dtSchema.Rows[0]["TABLE_NAME"].ToString();
                }

                new OleDbDataAdapter("SELECT * FROM [" + sheetName + "]", objConnection ).Fill(dsImport);
            }
            catch (Exception)
            {
                //raise exception if needed
            }
            finally
            {
                // Clean up.
                if(objConnection != null)
                {
                    objConnection.Close();
                    objConnection.Dispose();
                }
            }


            return dsImport.Tables[0];
            #region Commented code for importing data from CSV file.
            //              string strConnectionString = "Provider=Microsoft.Jet.OLEDB.4.0;" +"Data Source=" + System.IO.Path.GetDirectoryName(fullFileName) +";" +"Extended Properties=\"Text;HDR=YES;FMT=Delimited\"";
            //
            //              System.Data.OleDb.OleDbConnection conText = new System.Data.OleDb.OleDbConnection(strConnectionString);
            //              new System.Data.OleDb.OleDbDataAdapter("SELECT * FROM " + System.IO.Path.GetFileName(fullFileName).Replace(".", "#"), conText).Fill(dsImport);
            //              return dsImport.Tables[0];

            #endregion
        }

        /// <summary>
        /// This method checks if the user entered sheetName exists in the Schema Table
        /// </summary>
        /// <param name="sheetName">Sheet name to be verified</param>
        /// <param name="dtSchema">schema table </param>
        private static bool CheckIfSheetNameExists(string sheetName, DataTable dtSchema)
        {
            foreach(DataRow dataRow in dtSchema.Rows)
            {
                if( sheetName == dataRow["TABLE_NAME"].ToString() )
                {
                    return true;
                }   
            }
            return false;
        }
    }
}

Koogra-это компонент с открытым исходным кодом, написанный на C#, который читает и пишет файлы Excel.


а ты конкретно спроси .xls, подразумевая более старые форматы файлов, для форматов OpenXML (например, xlsx) я настоятельно рекомендую OpenXML SDK (http://msdn.microsoft.com/en-us/library/bb448854.aspx)


некоторое время назад я много читал из файлов Excel на C#, и мы использовали два подхода:

  • COM API, где вы получаете доступ к объектам Excel напрямую и манипулировать ими с помощью методов и свойств
  • драйвер ODBC, который позволяет использовать Excel как базу данных.

последний подход был много быстрее: чтение большой таблицы с 20 столбцами и 200 строками займет 30 секунд через COM и полсекунды через ODBC. Так Что Я ... порекомендовал бы подход к базе данных, если все, что вам нужно, это данные.

спасибо,

Карл


ExcelMapper-это инструмент с открытым исходным кодом (http://code.google.com/p/excelmapper/), которые можно использовать для чтения листов Excel Как строго типизированных объектов. Он поддерживает форматы xls и xlsx.


Я хочу показать простой метод для чтения файла xls /xlsx.Сеть. Я надеюсь, что следующее будет полезным для вас.

 private DataTable ReadExcelToTable(string path)    
 {

     //Connection String

     string connstring = "Provider=Microsoft.ACE.OLEDB.12.0;Data Source=" + path + ";Extended Properties='Excel 8.0;HDR=NO;IMEX=1';";  
     //the same name 
     //string connstring = Provider=Microsoft.JET.OLEDB.4.0;Data Source=" + path + //";Extended Properties='Excel 8.0;HDR=NO;IMEX=1';"; 

     using(OleDbConnection conn = new OleDbConnection(connstring))
     {
        conn.Open();
        //Get All Sheets Name
        DataTable sheetsName = conn.GetOleDbSchemaTable(OleDbSchemaGuid.Tables,new object[]{null,null,null,"Table"});  

        //Get the First Sheet Name
        string firstSheetName = sheetsName.Rows[0][2].ToString(); 

        //Query String 
        string sql = string.Format("SELECT * FROM [{0}]",firstSheetName); 
        OleDbDataAdapter ada =new OleDbDataAdapter(sql,connstring);
        DataSet set = new DataSet();
        ada.Fill(set);
        return set.Tables[0];   
   }
 }

код из статьи: http://www.c-sharpcorner.com/uploadfile/d2dcfc/read-excel-file-with-net/. Вы можете получить более подробную информацию от него.


не бесплатно, но с последним офисом есть очень хорошая автоматизация .Net API. (в течение долгого времени был API, но был неприятным COM) вы можете делать все, что хотите / нужно в коде, пока приложение Office остается скрытым фоновым процессом.


Простите меня, если я здесь не на базе, но разве это не то, что офис Пиа для?


в последнее время, частично, чтобы стать лучше в LINQ.... Я использую API автоматизации Excel для сохранения файла в виде таблицы XML, а затем обрабатываю этот файл с помощью LINQ to XML.


SpreadsheetGear для .NET является компонентом электронной таблицы, совместимым с Excel .Сеть. Вы можете увидеть, что наши клиенты говорят о производительности с правой стороны нашего страница продукта. Вы можете попробовать себя бесплатную полнофункциональную оценка.


SmartXLS является еще одним компонентом электронной таблицы excel, который поддерживает большинство функций диаграмм excel, движков формул и может читать/писать формат excel2007 openxml.


компонент .NET Excel Reader .NET может удовлетворить ваши требования. Это достаточно хорошо для чтения файлов XLSX и XLS. Так что попробуйте:

http://www.devtriogroup.com/ExcelReader


Я рекомендую библиотеку FileHelpers, которая является бесплатной и простой в использовании библиотекой .NET для импорта / экспорта данных из EXCEL, фиксированной длины или разделенных записей в файлах, строках или потоках + больше.

Раздел Документации Excel Data Link http://filehelpers.sourceforge.net/example_exceldatalink.html


вы можете попробовать использовать это решение с открытым исходным кодом, что делает работу с Excel намного чище.

http://excelwrapperdotnet.codeplex.com/


SpreadsheetGear является удивительным. Да, это расходы,но по сравнению с этими другими решениями это стоит того. Это быстро, надежно, очень всесторонне, и я должен сказать, что после использования этого продукта в моей полной программной работе более полутора лет, их поддержка клиентов фантастическая!


решение, которое мы использовали, необходимо, чтобы:

  • разрешить Читать/Писать из Excel производимых файлов
  • быть быстро в производительности (не так, как с помощью COMs)
  • быть MS Office независимая (необходимо использовать без клиентов с установленным MS Office)
  • быть свободный или Открыть Источник (но активно развивается)

есть несколько вариантов, но мы нашли NPoi (.NET-порт давно существующего Java Poi проект с открытым исходным кодом), чтобы быть лучшим: http://npoi.codeplex.com/

Она также позволяет работать с .док и. ppt-формат файла


Если это просто табличные данные. Я бы рекомендовал файл data helpers by Marcos Melli который можно скачать здесь.


поздно на вечеринку, но я поклонник LinqToExcel


вы можете написать электронную таблицу excel, которая загружает данную электронную таблицу excel и сохраняет ее как csv (а не делает это вручную).

тогда вы можете автоматизировать это с c#.

и как только его в csv, программа c# может grok это.

(кроме того, если кто-то просит вас программировать в excel, лучше притвориться, что вы не знаете, как)

(edit: Ах да, Роб и Райан оба правы)


Я знаю, что люди делают "расширение" Excel для этой цели.
Вы более или менее делаете кнопку в Excel с надписью "экспорт в программу X", а затем экспортируете и отправляете данные в формате, который программа может прочитать.

http://msdn.microsoft.com/en-us/library/ms186213.aspx должно быть хорошим местом для начала.

удачи


просто сделал быстрый демо-проект, который требовал управления некоторыми файлами excel. Компонент .NET от программного обеспечения GemBox был адекватен моим потребностям. Он имеет бесплатную версию с некоторыми ограничениями.

http://www.gemboxsoftware.com/GBSpreadsheet.htm


Пакет Excel является компонентом с открытым исходным кодом (GPL) для чтения/записи файлов Excel 2007. Я использовал его в небольшом проекте,и API прост. Работает только с XLSX (Excel 200&), а не с XLS.

исходный код также кажется хорошо организованным и легко обойти (если вам нужно расширить функциональность или исправить незначительные проблемы, как я сделал).

сначала я попробовал ADO.Net (строка подключения Excel) подход, но он был чреват неприятными хак - для если второй строка содержит число, она будет возвращать ints для всех полей в столбце ниже и тихо отбрасывать любые данные, которые не подходят.


мы используем:ClosedXML в довольно больших системах.

  • свободный
  • простота установки
  • прямое кодирование
  • очень отзывчивая поддержка
  • команда разработчиков составляет очень открыты для новых предложений. Часто новые функции и исправления ошибок, реализованные в течение одной недели

Take.io электронная таблица сделает эту работу за вас, и бесплатно. Просто взгляните на этой.


Я просто использовать ExcelLibrary загрузить .таблица xls в набор данных. Отлично сработало.