Інтернаціоналізація, локалізація, кодування, Ісландія та переклад веб-сайту з фотографіями японських котів
Що стосується інтернаціоналізації, локалізації та кодування у веб-додатках, там є багато інформації. Також є багато непорозумінь щодо того, що кожен пропонує для веб-програми. Ось моя думка ...
Коли веб-браузер встановлює з'єднання з веб-сервером, він передає чимало змінних і робить додаткові запити, ось приклад:
GET / HTTP / 1.1
Ведучий: www.dknewmedia.com
User-Agent: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-US; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
Accept: HTTP Accept = text / xml, application / xml, application / xhtml + xml, text / html; q = 0.9, text / plain; q = 0.8, image / png, * / *; q = 0.5
Accept-Language: en-us, en; q = 0.5
Accept-Encoding: gzip, deflate
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
Internationalization
Інтернаціоналізація складається з багатьох речей:
- Локалізація: Можливість визначити, з якої мови та місця відвідування відвідувач відвідує. Це робиться за допомогою HTTP-запитів, де відвідувач ідентифікується за мовою. У моєму випадку це en-US. "En" - англійська, а "US" - США. Це налаштування в моїй операційній системі.
- Часові зони: Можливість регулювання часових поясів. Зазвичай це досягається встановленням для вашого сервера середнього часу за Грінвічем (GMT), а потім дозволяючи користувачам встановлювати місцевий зсув від GMT.
- Кодування символів: Це можливість правильно відображати набори символів мови. Він відрізняється від локалізації, оскільки локалізація може вказати мені мову та регіон комп’ютера, з якого робиться запит, але вона не скаже мені, на якій мові читач запитує ... це залежить від читача!
Зверніть увагу в моєму заголовку HTTP, коли браузер робив запит, він повідомляв серверу, що він запитує мою локаль (Accept-Language: en-us); однак він також повинен повідомити серверу, який набір символів запитується (Accept-Charset: Accept-Charset: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 і utf -8 - це обидва допустимі набори символів.
Локалізація
У цьому фантастичному змішаному світі локалізація більше ніколи не диктує мови. Незважаючи на те, що я перебуваю в США, я можу абсолютно читати іншу мову, використовуючи інший набір символів ... саме це відбувається, коли я використовую Google хінді (Я насправді не використовую Google Hindi). Мій запит на локаль та набір символів ідентичний тому, що коли я запитую файл Google англійською мовою сторінки, але насправді я годую сторінкою, яку я не можу прочитати, оскільки у мене немає набору символів. Все це з’являється ??????????? ... Однак я можу завантажити цей набір символів у Firefox (Firefox> Налаштування> Додатково> Мови):
Якщо я завантажу цю мову, я можу запросити сторінку в її рідному наборі символів і відобразити її на своєму комп’ютері, хоча мовою мовою за промовчанням є en-US!
Отже ... якщо я студент хінді, я вивчаю англійську мову в Пердью і зв’язаний через VPN на сервер школи, на канікулах в Австралії ... є 3 різні параметри, які потрібно застосувати до програми, щоб бути справді інтернаціоналізованою - і ніхто залежать від іншого.
Мій регіон буде виглядати як en-US, але мій часовий пояс - Австралія, але мовою, яку я запитую на веб-сайті, може бути хінді. Якби я запрограмував свою заявку припущення виходячи з локалі мого комп’ютера, я б абсолютно помилявся - годував людину англійською мовою у східному часовому поясі. В ідеалі я запрограмував би свою програму обидва налаштування мови та часового поясу ... але я б не припускав їх на основі локалі.
Ісландія - найкращий приклад
Ми не знаємо про багатомовні та багатомовні виклики у Сполучених Штатах, де ми є всі розмовляти англійською мовою [мається на увазі сарказм]. У деяких країнах, таких як Ісландія, хоча рідною мовою є ісландська, неймовірні ісландські люди виростають, вивчаючи 3 мови! Оскільки Ісландія - це країна посеред Європи та Північної Америки, їхні компанії працюють на різних континентах, мовах, діалектах мов та кількох часових поясах зі свого робочого столу!
Багато ісландських веб-сайтів побудовано англійською мовою США, англійською, ісландською, іспанською, іспанською, французькою та німецькою! Тільки уявіть, наскільки складно було б будувати Icelandair's веб-додатки та системи продажу квитків ... вау!
ЗАМОВЛЕННЯ: Я мав абсолютне задоволення працювати з найкращими людьми із Icelandair, і можу сказати вам, що це одні з найталановитіших і доброзичливих професіоналів, з якими я мав задоволення працювати. Це просто дивовижна країна та люди! Піди в гості ... візьми Icelandair і обов’язково відвідай Blue Lagoon!
Мова проти кодування
Існують навіть різні кодування символів в одній мові, які погано граються між собою! Приклад: Японський електронний лист, написаний у Shift-JIS, може стати нечитабельним на комп’ютері японця з локалізацією, встановленою на ja-JP, оскільки їх поштовий сервер розпізнає лише EUC-JP. В ідеалі, клієнт повинен мати можливість встановити, яке кодування він хотів би, а також яку мову - просто переконавшись, що кодування та мова сумісні з тим, що вимагає клієнт.
Якщо я хочу прочитати японську мову, мені, можливо, доведеться вибрати обидві японські мови як мою І Shift-JIS для кодування, щоб правильно відображати цю мову. Ось ще кілька плутанини, щоб додати до суміші ... деякі типи кодування підтримують кілька мов. UNICODE / UTF8 підтримує десятки. Зворотне також справедливе. Деякі мови можна читати різними типами кодування. Якщо це не має сенсу ... Перепрошую, це дуже складне питання.
Якось я вірю (сподіваюся), що все це зміниться. Я думаю, що оригінальні розробники кодів локалізації сподівались, що комбінація мова-країна буде всім необхідним ... але ми стали набагато витонченішими. Пам’ятайте, велика частина цього була розроблена до існування Інтернету. З появою ГІС, можливо, людина може вибрати своє кодування, і ГІС оброблятиме часовий пояс та інформацію про регіон.
Internationalization
Назад до підтримки інтернаціоналізації. Якщо ви хочете надати Інтернаціоналізовану заявку, вам потрібно:
- Підтримують різні типи кодування, мови та мають файли перекладів для відображення цих перекладів.
- Дозвольте клієнту встановити свою мову та, можливо, тип кодування, якщо це необхідно.
- Підтримуйте часові пояси, дозволяючи користувачам посилатися на свій часовий пояс порівняно з GMT.
- Використовуйте коди локалізації з обережністю ... вони НЕ точно відображають те, що насправді запитує ваш користувач, і те, що він може прочитати.
Переклад
Машинний переклад ще перебуває в зародковому стані. Існує ряд веб-сайтів (і WordPress Модулі), які пропонують машинний переклад вашого сайту. Не спокушайтеся це зробити ... є дві причини, чому:
- Якщо працює машинний переклад, користувач, який перевіряє ваш сайт, уже матиме перекладача для роботи.
- Машинний переклад відстій.
Не вірите мені? Ось вам японський переклад:
Вставлено з Файл Masatsu - чувак з безліччю фотографій котів:
Запис у японському блозі
???
- 00:29:35 Масацу??????????????????????????
???????????????????????????????????? (?)?
??????????????????????????????????????????
????????????????????????????????????????????????????????????????? (?)
?????????????????
??????????????
???
??????????????????????????????????????????
???????????????????????????????
??????????????????????????????????????
????????????????????????????????????
?????????? Ag ????????????????????????????????????????????????????
Машинний переклад:
?? Ханн ?????
-00: 29: 35 МасацуІм'я першого святого / слона, що з'явився на вчорашньому "а / звіриному кулачному флоті ?? рейнджер ”“ ?? Ханн ???? ” з / актором радіо Ютакою Мізусімою….
? (?) що робить каракатиць легко.
Бо навіть радіоактор першого святого, майстер ????? з / кота - китайська айва нагайського Ічіро = драконовий кулька посох / Рейнджер схожий на людей, яких дотепне зауваження знає охоче.
?????? (Піт), про який я цього року повністю забув, "таємницю назви суперфлоту", звичайної практики щороку?,
?????? Якщо я пишу із запізненням цього року,
??????? святиня ??? (може як?)? мис жереб (не ріжеться) Фукамі (? або спостерігати здатний?) an / the це те, що робить
?????? З, воно стає “балончиком /? /?”, Іншими словами, “кунг-фу”, коли вишиковуються та змінюють голову а / імені.
?????? Хоча, як кажуть, збільшують ще два, нібито, це може стати яким типом.
Правду кажуть "віком", тому що символом срібного елемента є Ag?, Хоча назва "the ???? срібло ”Такаока? технік ??????? думав, що персонаж називається "?" було використано для асоціації срібного екрану? фільму, якщо воно називає його доданим членом.
Але я думаю егоїстично, що моя теорія не пов'язана з "?" входить у / китайський ієрогліф.
Я впевнений, зміна полярності цього перекладу забезпечить не менш читабельну дикцію англійською мовою. Ви зрозуміли запис, правда?