MySQL « MySQL кодировка дампа

Привет.


Вот получил я только что дамп MySQL на 35мб... Файл в формате UTF-8. Порадовался, залил в базу и обнаружил, что пришли они - кракозябры.

Вообщем посмотрев на дамп я могу сделать выводы, что все таблицы были в кодировке latin1, а дампили файл в UTF-8.


/** * GeSHi (C) 2004 - 2007 Nigel McNie, 2007 - 2008 Benny Baumann * (http://qbnz.com/highlighter/ and http://geshi.org/) */ .mysql.geshi_code {font-family:monospace;} .mysql.geshi_code .imp {font-weight: bold; color: red;} .mysql.geshi_code .kw1 {color: #990099; font-weight: bold;} .mysql.geshi_code .kw2 {color: #990099; font-weight: bold;} .mysql.geshi_code .kw3 {color: #9900FF; font-weight: bold;} .mysql.geshi_code .kw4 {color: #999900; font-weight: bold;} .mysql.geshi_code .kw5 {color: #999900; font-weight: bold;} .mysql.geshi_code .kw6 {color: #FF9900; font-weight: bold;} .mysql.geshi_code .kw7 {color: #FF9900; font-weight: bold;} .mysql.geshi_code .kw8 {color: #9900FF; font-weight: bold;} .mysql.geshi_code .kw9 {color: #9900FF; font-weight: bold;} .mysql.geshi_code .kw10 {color: #CC0099; font-weight: bold;} .mysql.geshi_code .kw11 {color: #CC0099; font-weight: bold;} .mysql.geshi_code .kw12 {color: #009900;} .mysql.geshi_code .kw13 {color: #000099;} .mysql.geshi_code .kw14 {color: #000099;} .mysql.geshi_code .kw15 {color: #000099;} .mysql.geshi_code .kw16 {color: #000099;} .mysql.geshi_code .kw17 {color: #000099;} .mysql.geshi_code .kw18 {color: #000099;} .mysql.geshi_code .kw19 {color: #000099;} .mysql.geshi_code .kw20 {color: #000099;} .mysql.geshi_code .kw21 {color: #000099;} .mysql.geshi_code .kw22 {color: #000099;} .mysql.geshi_code .kw23 {color: #000099;} .mysql.geshi_code .kw24 {color: #000099;} .mysql.geshi_code .kw25 {color: #000099;} .mysql.geshi_code .kw26 {color: #000099;} .mysql.geshi_code .kw27 {color: #00CC00;} .mysql.geshi_code .coMULTI {color: #808000; font-style: italic;} .mysql.geshi_code .co1 {color: #808080; font-style: italic;} .mysql.geshi_code .co2 {color: #808080; font-style: italic;} .mysql.geshi_code .es0 {color: #004000; font-weight: bold;} .mysql.geshi_code .es1 {color: #008080; font-weight: bold;} .mysql.geshi_code .br0 {color: #FF00FF;} .mysql.geshi_code .sy1 {color: #CC0099;} .mysql.geshi_code .sy2 {color: #000033;} .mysql.geshi_code .st0 {color: #008000;} .mysql.geshi_code .nu0 {color: #008080;} .mysql.geshi_code span.xtra { display:block; }

/*!40101 SET @OLD_CHARACTER_SET_CLIENT=@@CHARACTER_SET_CLIENT */;
/*!40101 SET @OLD_CHARACTER_SET_RESULTS=@@CHARACTER_SET_RESULTS */;
/*!40101 SET @OLD_COLLATION_CONNECTION=@@COLLATION_CONNECTION */;
/*!40101 SET NAMES utf8 */;
/*!40103 SET @OLD_TIME_ZONE=@@TIME_ZONE */;
/*!40103 SET TIME_ZONE='+00:00' */;
/*!40014 SET @OLD_UNIQUE_CHECKS=@@UNIQUE_CHECKS, UNIQUE_CHECKS=0 */;
/*!40014 SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS, FOREIGN_KEY_CHECKS=0 */;
/*!40101 SET @OLD_SQL_MODE=@@SQL_MODE, SQL_MODE='NO_AUTO_VALUE_ON_ZERO' */;
/*!40111 SET @OLD_SQL_NOTES=@@SQL_NOTES, SQL_NOTES=0 */;

--
-- Not dumping tablespaces as no INFORMATION_SCHEMA.FILES table on this server
--

--
-- Table structure for table `XXX`
--

DROP TABLE IF EXISTS `XXX`;
CREATE TABLE `XXX` (
  `id` int(11) NOT NULL auto_increment,
...
...
) ENGINE=MyISAM AUTO_INCREMENT=37 DEFAULT CHARSET=latin1;
 



Вопрос - как с этим дампом теперь можно поработать чтобы привести его в нормальный вид?

PS заливал дамп с помощью bigdump кодировку пробовал уже ставить cp1251, utf8, latin1 - все равно кракозябры и каждый раз разные о_О
--

1 ответов


Для вашей базы и таблиц которые из кодировок выбраны в качестве базовых?
Если там все в порядке, то достаточно будет сделать просто:


mysqldump -u user -p pass --default-character-set=utf8 --quote-names DB > DB.sql
 

Если все создавалось без учета UTF, то желательно пересоздать таблицы примерно следующим образом:


# дамп
mysqldump --user=username --password=password --default-character-set=latin1 --skip-set-charset dbname > dump.sql

# изменяем кодировку
chgrep latin1 utf8 dump.sql

# Создаем базу в правильной кодировке
mysql --user=username --password=password --execute="DROP DATABASE dbname; CREATE DATABASE dbname CHARACTER SET utf8 COLLATE utf8_general_ci;"

# Вставляем все на место
mysql --user=username --password=password --default-character-set=utf8 dbname < dump.sql
 

открыть текстовым редактором (да, даже если дамп весит 35 Мб), посмотреть что кодировка дампа действительно utf-8, если нет - то привести к utf-8
затем в CREATE TABLE заменить везде latin1 и прочие кодировки на utf8 (collate - на utf8_general_ci)


Недавно совершенно неожиданно пришлось перекодировать дамп из cp1252. Делать нужно было быстро, поэтому делал так: взял содержимое дампа (прям с кракозябликами), загнал в декодер Лебедева, перегнал в utf8, заменил все «latin1» в «DEFAULT CHARSET=» на utf8 (автозаменой в Notepad++), залил обратно через PMA.

Может быть, поможет и вам.