Странные символы, добавленные в имя первого столбца после чтения CSV-файла, экспортированного жабой

всякий раз, когда я читаю csv файл в R (read.csv("file_name.csv")), который был экспортирован с помощью toad, имя первого столбца предваряется следующими символами"ï..". Кроме того, открытие csv-файла в excel или notepad++ отображается правильно (без предыдущих символов). Это хлопот, как мой обходной путь был переименовать столбец после каждого чтения. Спасибо за любое исправление этой проблемы!

Edit:
Экспорт был создан в Toad, щелкнув правой кнопкой мыши на результирующем наборе запрос и выбор
'быстрый экспорт - > файл - > CSV-файл'

подробнее в комментарий:
head(readLines('test_file.csv'),n=3)
[1] "ID,LOCATION" "12021,1204" "12281,1204"

2 ответов


попробуйте это:

d <- read.csv("test_file.csv", fileEncoding="UTF-8-BOM")

это работает в R 3.0.0+ и удаляет спецификацию, если она присутствует в файле (общий для файлов, созданных из приложений Microsoft: Excel, SQL server)


после дальнейшего исследования это связано с добавлением символов BOM (Byte Order Mark). По-видимому, нельзя использовать быстрый экспорт, но мастер экспорта данных вместо этого, поскольку он позволяет установить кодировку файла. Он работал для меня, установив его на западноевропейский (Windows) вместо unicode utf-8.

посмотреть Как удалить ï " ¿из начала файла?