Інтернаціоналізація, локалізація, кодування, Ісландія та переклад веб-сайту з фотографіями японських котів

переклад інтернаціоналізації

InternationalizationЩо стосується інтернаціоналізації, локалізації та кодування у веб-додатках, там є багато інформації. Також є багато непорозумінь щодо того, що кожен пропонує для веб-програми. Ось моя думка ...

Коли веб-браузер встановлює з'єднання з веб-сервером, він передає чимало змінних і робить додаткові запити, ось приклад:

GET / HTTP / 1.1
Ведучий: www.dknewmedia.com
User-Agent: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-US; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
Accept: HTTP Accept = text / xml, application / xml, application / xhtml + xml, text / html; q = 0.9, text / plain; q = 0.8, image / png, * / *; q = 0.5
Accept-Language: en-us, en; q = 0.5
Accept-Encoding: gzip, deflate
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

Internationalization

Інтернаціоналізація складається з багатьох речей:

  1. Локалізація: Можливість визначити, з якої мови та місця відвідування відвідувач відвідує. Це робиться за допомогою HTTP-запитів, де відвідувач ідентифікується за мовою. У моєму випадку це en-US. "En" - англійська, а "US" - США. Це налаштування в моїй операційній системі.
  2. Часові зони: Можливість регулювання часових поясів. Зазвичай це досягається встановленням для вашого сервера середнього часу за Грінвічем (GMT), а потім дозволяючи користувачам встановлювати місцевий зсув від GMT.
  3. Кодування символів: Це можливість правильно відображати набори символів мови. Він відрізняється від локалізації, оскільки локалізація може вказати мені мову та регіон комп’ютера, з якого робиться запит, але вона не скаже мені, на якій мові читач запитує ... це залежить від читача!

Зверніть увагу в моєму заголовку HTTP, коли браузер робив запит, він повідомляв серверу, що він запитує мою локаль (Accept-Language: en-us); однак він також повинен повідомити серверу, який набір символів запитується (Accept-Charset: Accept-Charset: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 і utf -8 - це обидва допустимі набори символів.

Локалізація

У цьому фантастичному змішаному світі локалізація більше ніколи не диктує мови. Незважаючи на те, що я перебуваю в США, я можу абсолютно читати іншу мову, використовуючи інший набір символів ... саме це відбувається, коли я використовую Google хінді (Я насправді не використовую Google Hindi). Мій запит на локаль та набір символів ідентичний тому, що коли я запитую файл Google англійською мовою сторінки, але насправді я годую сторінкою, яку я не можу прочитати, оскільки у мене немає набору символів. Все це з’являється ??????????? ... Однак я можу завантажити цей набір символів у Firefox (Firefox> Налаштування> Додатково> Мови):

Мова завантаження Firefox

Якщо я завантажу цю мову, я можу запросити сторінку в її рідному наборі символів і відобразити її на своєму комп’ютері, хоча мовою мовою за промовчанням є en-US!

Отже ... якщо я студент хінді, я вивчаю англійську мову в Пердью і зв’язаний через VPN на сервер школи, на канікулах в Австралії ... є 3 різні параметри, які потрібно застосувати до програми, щоб бути справді інтернаціоналізованою - і ніхто залежать від іншого.

Мій регіон буде виглядати як en-US, але мій часовий пояс - Австралія, але мовою, яку я запитую на веб-сайті, може бути хінді. Якби я запрограмував свою заявку припущення виходячи з локалі мого комп’ютера, я б абсолютно помилявся - годував людину англійською мовою у східному часовому поясі. В ідеалі я запрограмував би свою програму обидва налаштування мови та часового поясу ... але я б не припускав їх на основі локалі.

Ісландія - найкращий приклад

Ми не знаємо про багатомовні та багатомовні виклики у Сполучених Штатах, де ми є всі розмовляти англійською мовою [мається на увазі сарказм]. У деяких країнах, таких як Ісландія, хоча рідною мовою є ісландська, неймовірні ісландські люди виростають, вивчаючи 3 мови! Оскільки Ісландія - це країна посеред Європи та Північної Америки, їхні компанії працюють на різних континентах, мовах, діалектах мов та кількох часових поясах зі свого робочого столу!

Багато ісландських веб-сайтів побудовано англійською мовою США, англійською, ісландською, іспанською, іспанською, французькою та німецькою! Тільки уявіть, наскільки складно було б будувати Icelandair's веб-додатки та системи продажу квитків ... вау!

ЗАМОВЛЕННЯ: Я мав абсолютне задоволення працювати з найкращими людьми із Icelandair, і можу сказати вам, що це одні з найталановитіших і доброзичливих професіоналів, з якими я мав задоволення працювати. Це просто дивовижна країна та люди! Піди в гості ... візьми Icelandair і обов’язково відвідай Blue Lagoon!

Мова проти кодування

Існують навіть різні кодування символів в одній мові, які погано граються між собою! Приклад: Японський електронний лист, написаний у Shift-JIS, може стати нечитабельним на комп’ютері японця з локалізацією, встановленою на ja-JP, оскільки їх поштовий сервер розпізнає лише EUC-JP. В ідеалі, клієнт повинен мати можливість встановити, яке кодування він хотів би, а також яку мову - просто переконавшись, що кодування та мова сумісні з тим, що вимагає клієнт.

Якщо я хочу прочитати японську мову, мені, можливо, доведеться вибрати обидві японські мови як мою І Shift-JIS для кодування, щоб правильно відображати цю мову. Ось ще кілька плутанини, щоб додати до суміші ... деякі типи кодування підтримують кілька мов. UNICODE / UTF8 підтримує десятки. Зворотне також справедливе. Деякі мови можна читати різними типами кодування. Якщо це не має сенсу ... Перепрошую, це дуже складне питання.

Якось я вірю (сподіваюся), що все це зміниться. Я думаю, що оригінальні розробники кодів локалізації сподівались, що комбінація мова-країна буде всім необхідним ... але ми стали набагато витонченішими. Пам’ятайте, велика частина цього була розроблена до існування Інтернету. З появою ГІС, можливо, людина може вибрати своє кодування, і ГІС оброблятиме часовий пояс та інформацію про регіон.

Internationalization

Назад до підтримки інтернаціоналізації. Якщо ви хочете надати Інтернаціоналізовану заявку, вам потрібно:

  1. Підтримують різні типи кодування, мови та мають файли перекладів для відображення цих перекладів.
  2. Дозвольте клієнту встановити свою мову та, можливо, тип кодування, якщо це необхідно.
  3. Підтримуйте часові пояси, дозволяючи користувачам посилатися на свій часовий пояс порівняно з GMT.
  4. Використовуйте коди локалізації з обережністю ... вони НЕ точно відображають те, що насправді запитує ваш користувач, і те, що він може прочитати.

Переклад

Машинний переклад ще перебуває в зародковому стані. Існує ряд веб-сайтів (і WordPress Модулі), які пропонують машинний переклад вашого сайту. Не спокушайтеся це зробити ... є дві причини, чому:

  1. Якщо працює машинний переклад, користувач, який перевіряє ваш сайт, уже матиме перекладача для роботи.
  2. Машинний переклад відстій.

Не вірите мені? Ось вам японський переклад:
Вставлено з Файл Masatsu - чувак з безліччю фотографій котів:

Запис у японському блозі

???
- 00:29:35 Масацу

??????????????????????????
??????????????????????????

?????????? (?)?

??????????????????????????????????????????
??????????????????????????????

??????????????????????????????????? (?)

?????????????????

??????????????
???
???

???????????????????????????????????????

???????????????????????????????

??????????????????????????????????????
????????????????????????????????????
?????????? Ag ??????????????

?????????????????????????????????????

Машинний переклад:

?? Ханн ?????
-00: 29: 35 Масацу

Ім'я першого святого / слона, що з'явився на вчорашньому "а / звіриному кулачному флоті ?? рейнджер ”“ ?? Ханн ???? ” з / актором радіо Ютакою Мізусімою….

? (?) що робить каракатиць легко.

Бо навіть радіоактор першого святого, майстер ????? з / кота - китайська айва нагайського Ічіро = драконовий кулька посох / Рейнджер схожий на людей, яких дотепне зауваження знає охоче.

?????? (Піт), про який я цього року повністю забув, "таємницю назви суперфлоту", звичайної практики щороку?,

?????? Якщо я пишу із запізненням цього року,

??????? святиня ??? (може як?)? мис жереб (не ріжеться) Фукамі (? або спостерігати здатний?) an / the це те, що робить

?????? З, воно стає “балончиком /? /?”, Іншими словами, “кунг-фу”, коли вишиковуються та змінюють голову а / імені.

?????? Хоча, як кажуть, збільшують ще два, нібито, це може стати яким типом.

Правду кажуть "віком", тому що символом срібного елемента є Ag?, Хоча назва "the ???? срібло ”Такаока? технік ??????? думав, що персонаж називається "?" було використано для асоціації срібного екрану? фільму, якщо воно називає його доданим членом.

Але я думаю егоїстично, що моя теорія не пов'язана з "?" входить у / китайський ієрогліф.

Я впевнений, зміна полярності цього перекладу забезпечить не менш читабельну дикцію англійською мовою. Ви зрозуміли запис, правда?

2 Коментарі

  1. 1

Що ви думаєте?

Цей сайт використовує Akismet для зменшення спаму. Дізнайтеся, як обробляються ваші дані коментарів.