Функция подсчета количества строк в текстовом файле
нужна функция, которая принимает имя файла в качестве параметра и затем возвращать количество строк в этом файле.
должно занять менее 30 секунд, чтобы получить количество 10 миллионов файлов строк.
В настоящее время есть что - то вроде-но это слишком медленно с большими файлами:
Dim objFSO, strTextFile, strData, arrLines, LineCount
CONST ForReading = 1
'name of the text file
strTextFile = "sample.txt"
'Create a File System Object
Set objFSO = CreateObject("Scripting.FileSystemObject")
'Open the text file - strData now contains the whole file
strData = objFSO.OpenTextFile(strTextFile,ForReading).ReadAll
'Split by lines, put into an array
arrLines = Split(strData,vbCrLf)
'Use UBound to count the lines
LineCount = UBound(arrLines) + 1
wscript.echo LineCount
'Cleanup
Set objFSO = Nothing
6 ответов
единственная альтернатива, которую я вижу, - читать строки один за другим (EDIT: или даже просто пропустить их по одному) вместо того, чтобы читать весь файл сразу. К сожалению, я не могу проверить, что сейчас быстрее. Думаю, прыгать быстрее.
Dim objFSO, txsInput, strTemp, arrLines
Const ForReading = 1
Set objFSO = CreateObject("Scripting.FileSystemObject")
strTextFile = "sample.txt"
txsInput = objFSO.OpenTextFile(strTextFile, ForReading)
'Skip lines one by one
Do While txsInput.AtEndOfStream <> True
txsInput.SkipLine ' or strTemp = txsInput.ReadLine
Loop
wscript.echo txsInput.Line-1 ' Returns the number of lines
'Cleanup
Set objFSO = Nothing
кстати, я взял на себя смелость удалить некоторые из ваших 'comments
. С точки зрения хорошей практики они были излишними и не добавляли никакой объяснительной ценности, особенно когда они в основном повторяли сами имена методов, например,
'Create a File System Object
... CreateObject("Scripting.FileSystemObject")
Если кто-то все еще ищет более быстрый способ, Вот код:
Set fso = CreateObject("Scripting.FileSystemObject")
Set theFile = fso.OpenTextFile("C:\textfile.txt", 8, True)
WScript.Echo theFile.Line
Set Fso = Nothing
конечно, время обработки зависит от размера файла, а не только от количества строк. По сравнению с методом RegEx TextStream.Свойство Line по крайней мере в 3 раза быстрее.
слишком большие файлы...
Следующее наиболее эффективно способ я знаю:
Dim oFso, oReg, sData, lCount
Const ForReading = 1, sPath = "C:\file.txt"
Set oReg = New RegExp
Set oFso = CreateObject("Scripting.FileSystemObject")
sData = oFso.OpenTextFile(sPath, ForReading).ReadAll
With oReg
.Global = True
.Pattern = "\r\n" 'vbCrLf
'.Pattern = "\n" ' vbLf, Unix style line-endings
lCount = .Execute(sData).Count + 1
End With
WScript.Echo lCount
Set oFso = Nothing
Set oReg = Nothing
вы можете попробовать некоторые варианты этого
cnt = 0
Set fso = CreateObject("Scripting.FileSystemObject")
Set theFile = fso.OpenTextFile(filespec, ForReading, False)
Do While theFile.AtEndOfStream <> True
theFile.SkipLine
c = c + 1
Loop
theFile.Close
WScript.Echo c,"lines"
Я искал более быстрый способ, чем мне уже приходилось определять количество строк в текстовом файле. Я искал в интернете и наткнулся на 2 перспективное решение. Одним из них было решение на основе SQL, а другим-решение, которое я нашел здесь на основе Fso Кул-Тигина. Я протестировал их, и это часть результата:
Number of lines Time elapsed Variant
--------------------------------------------------------
110 00:00:00.70 SQL
110 00:00:00.00 Vanilla VBA (my solution)
110 00:00:00.16 FSO
--------------------------------------------------------
1445014 00:00:17.25 SQL
1445014 00:00:09.19 Vanilla VBA (my solution)
1445014 00:00:17.73 FSO
я запускал это несколько раз с большими и малыми числами. Снова и снова ванильный VBA выходил на первое место. Я знаю, что это устарело, но для всех все еще ищете самый быстрый способ определить количество строк в csv / текстовом файле, вот код, который я использую.
Public Function GetNumRecs(ASCFile As String) As Long
Dim InStream As Long
Dim Record As String
InStream = FreeFile
GetNumRecs = 0
Open ASCFile For Input As #InStream
Do While Not EOF(InStream)
Line Input #InStream, Record
GetNumRecs = GetNumRecs + 1
Loop
Close #InStream
End Function
txt = "c:\YourTxtFile.txt"
j = 0
Dim read
Open txt For Input As #1
Do While Not EOF(1)
Input #1, read
j = j + 1
Loop
Close #1
если он добавляет пустую последнюю строку, результатом будет (j - 1)
.
Он отлично работает для одного столбца в текстовый файл.