Декодирование кракозябров - чем?
Select messages from
# through # FAQ
[/[Print]\]

Total Commander -> Программное обеспечение

#1: Декодирование кракозябров - чем? Author: Ciber SLasHLocation: С.-Петербург PostPosted: Sat Jul 30, 2016 23:19
    —
Приветствую всех!
Столкнулся с проблемой кракозябров в именах файлов. Не удаётся декодировать кракозябры в осмысленные имена:
Code:
íÏÄÕÌØ ÓÂÏÒÎÏ_ÒÁÚÂÏÒÎÙÊ_óÐÅÃÉÆÉËÁÃÉÑ.jpg
ìâ_ òÅËÌÁÍÎÁÑ ËÏÍÐÁÎÉÑ õÔÏÞÎÅÎÎÙÊ ×ÁÒÉÁÎÔ.xls
Ïðîãðàììà ñåìèíàðà_×åðíîãîðèÿ 2011 èñõ 13.09.11.pdf
ïËÁÚÁÎÉÅ ÕÓÌÕÇ-ËÁÓÓÙ Fall Out Boy.doc
ó×ÅÔÌÁÎÏ×ÓËÉÊ úÁÌ -2014-2015ÇÇ._13 ÐÏÑÓÏ×.xls
ó×ÅÔÌÁÎÏ×ÓËÉÊ ÚÁÌ_2014-2015ÇÇ._9 ÐÏÑÓÏ× (1).xls
óðòá÷ëá ï óðåëôáëìå ÷ïóðïíéîáîéñ áäòéáîï.doc
–ü—Ä–∏–≥–ª–∞—Å–∏—Ç–µ–ª—å–Ω—ã–µ –±–∏–ª–µ—Ç—ã - Lana_.docx
ïËÁÚÁÎÉÅ ÕÓÌÕÇ-ËÁÓÓÙ Fall Out Boy.doc
Ïîäãîòîâêà îáúåêòà ê ðåêîíñòðóêöèè.pdf

Штирлиц - не смог;
Универсальный декодер - конвертер кириллицы - не смог;
Декодер Лебедева - не смог.

Чем декодировать это безобразие?

Вот файл, который открывает на редактирование TC по Ctrl+M: http://f-bit.ru/774562

#2:  Author: MVVLocation: Ростов-Дон PostPosted: Sun Jul 31, 2016 04:46
    —
Покрутил-повертел, заметил, что вроде символы из 1252 используются (стандартная европейская кодировка), но почему-то диакритика отделена (отдельными псевдосимволами идёт), хотя символы европейских кодировок содержат её в себе.
На ум пришла нормализация юникода. Взял тестовое слово из последней строки примера:
Code:
îáúåêòà

Нашел первый попавшийся онлайн нормализатор, вставил слово в первое поле, ткнул наугад в NFC, получил вроде то же самое на вид:
Code:
îáúåêòà

Но это уже спокойно сохранилось в однобайтной Win-1252, после чего я открыл файл по F3 и получил:
Quote:
объекта

Ну и всё имя тестового файла целиком:
Quote:
Подготовка объекта к реконструкции.pdf

Т.о., необходимо выполнить нормализацию юникода в файле, а потом попытаться сохранить в кодировке Win-1252 и открыть файл как Win-1251.

#3:  Author: FlasherLocation: Москва PostPosted: Sun Jul 31, 2016 05:28
    —
Про отделённую диакритику уже писал в Общих.
Про нормализатор не знал, что бывают такие. Вроде после склейки работает. Универсальный декодер в основном справляется.
Только что насчёт этого?:
Code:
–ü—Ä–∏–≥–ª–∞—Å–∏—Ç–µ–ª—å–Ω—ã–µ –±–∏–ª–µ—Ç—ã - Lana_.docx

#4:  Author: Ciber SLasHLocation: С.-Петербург PostPosted: Sun Jul 31, 2016 05:36
    —
MVV
Благодарю!!
Сначала копипастю в нормализатор, потом его результат копипастю в универсальный декодер - профит... кроме:
Quote:
–ü—Ä–∏–≥–ª–∞—Å–∏—Ç–µ–ª—å–Ω—ã–µ –±–∏–ª–µ—Ç—ã - Lana_.docx

но это похоже на необратимую строку. Т.е. на автомате уже не раскодировать...

#5:  Author: MVVLocation: Ростов-Дон PostPosted: Sun Jul 31, 2016 20:58
    —
Очень похоже на необратимое искажение, т.к. сильно из общей колеи выбивается (например, в Win-1252 нет греческих символов).

#6:  Author: Golimodin PostPosted: Sun Oct 23, 2016 11:54
    —
В онлайне можно попробовать Wink

#7:  Author: MVVLocation: Ростов-Дон PostPosted: Sun Oct 23, 2016 13:28
    —
Golimodin wrote:
В онлайне можно попробовать Wink

Пост ради поста? Во-первых, без конкретных адресов сайтов, где имеет смысл пробовать, во-вторых, вообще без гарантии того, что это будет иметь смысл...

#8:  Author: Skif_off PostPosted: Sun Oct 23, 2016 14:25
    —
К слову, помимо онлайн-нормализаторов есть и плагин NFCname.

#9:  Author: AvadaLocation: Россия, Саратов PostPosted: Mon Oct 24, 2016 09:20
    —
Golimodin
Если нечего сказать по существу дела, лучше промолчать.
Замечание за флуд.



Total Commander -> Программное обеспечение


output generated using printer-friendly topic mod. All times are GMT + 4 Hours

Page 1 of 1

Powered by phpBB © 2001, 2005 phpBB Group