WordPress

Witaj Gościu ( Zaloguj | Rejestruj )

Każdy temat założony w ewidentnie złym dziale będzie usuwany! Proszę czytać opisy działów i regulamin!

2 Stron V   1 2 >  
Reply to this topicStart new topic
> UTF8
savek
post 13.1.2006 - 12:33
Post #1


aktywność:
****

Grupa: +Bloger
Postów: 128

Nr: 3



To już nie czasy gdy www robi się oparciu o treść kursu HTML Pawła Wimmera. (nie nie do Pana Pawła nic nie mam - przeciwnie)

Polecam art.: Dlaczego UTF-8 ?
http://i18n-l10n.com/News/article/sid=3.html

Ten post edytował savek 13.1.2006 - 12:35


--------------------
user posted image
Go to the top of the page
 
+Quote Post
Mlody
post 13.1.2006 - 16:03
Post #2


aktywność:
**

Grupa: +Bloger
Postów: 33

Nr: 112



savek - jak w notepad zapiszesz jako UTF to wtedy pojawiają się błedy na stronie, więc tak nie da rady zrobić przynajmniej w WP.
Go to the top of the page
 
+Quote Post
empiryk
post 13.1.2006 - 19:24
Post #3


aktywność:
**

Grupa: +Bloger
Postów: 42

Nr: 125



CYTAT(savek @ Jan 13 2006, 11:33 AM)
To już nie czasy gdy www robi się oparciu o treść kursu HTML Pawła Wimmera. (nie nie do Pana Pawła nic nie mam - przeciwnie)
Polecam art.: Dlaczego UTF-8 ?
UTF przydaje się w wielu sytuacjach, ale trzymanie się go tylko dlatego, bo jest modny - to jest przesada. Jego podstawowe zastosowanie jest jedno: możliwość tworzenia aplikacji w wielu językach równocześnie. Ewentualnie: potrzeba stosowania jakichś znaków specjalnych. Koniec. Innych interesujących powodów nie ma.


--------------------
GH/P/SS d- s:+ a40 C++ L+ W+++ N++ K- w O-- M-- PS--- PE+ Y+ PGP++ t--- 5-- X++++ R- b++ DI- D-- G e+++ h---- r+++ z+++
Go to the top of the page
 
+Quote Post
pablo
post 14.1.2006 - 09:19
Post #4


aktywność:
**

Grupa: +Bloger
Postów: 22

Nr: 9



@empiryk - ale wzbranianie sie przed utf8 tylko dlatego, że teraz uważany jest przez niektórych za modny czy "dżezi" też jest przesadą.

Sensowniej jest porównac kodowania pod względem wsparcia dla nich w różnych technologiach programowania, a tym samym ich zastosowań i na tej podstawie wybrać najsensowniejszy dla siebie. Pojawiają sie bowiem problemy przy operacjach na napiasach z ogonkami, przy porządkowaniu zapytań SQL'owych (order by), przy korzystaniu z biblioteki GD i inne.

Obszerne opracowanie na ten temat sporządził pan Włodzimierz Gajda.

Przy wyborze kodowania w WP oprócz kryterium wielojęzyczności strony widzę jeszcze inne:
- "pokręcona" konfiguracja serwera baz danych uniemożliwiająca poprawny zapis w takim czy innym kodowaniu;
- zintegrowanie WP z innymi skryptami, które na utf8 z ogonkami nie zawsze działają dobrze (albo ich przenosiny na utf8 są niopłacalne). Przykład: Do bloga na WP(utf8) pobieram ostanie wątki z forum PunBB(iso-8859-2) za pomoca skryptu extern.php. Bez przeróbki funkcji w tym skrypcie zamiast ogonków dostaniemy krzaki.
Go to the top of the page
 
+Quote Post
lipa
post 14.1.2006 - 12:30
Post #5


aktywność:
**

Grupa: +Bloger
Postów: 37

Nr: 15



CYTAT(pablo @ Jan 14 2006, 09:19 AM)
[...] Przykład: Do bloga na WP(utf8) pobieram ostanie wątki z forum PunBB(iso-8859-2) za pomoca skryptu extern.php. Bez przeróbki funkcji w tym skrypcie zamiast ogonków dostaniemy krzaki.
*


Mały off-topic:

Przepisałem pliki językowe PunBB 1.2.9 na UTF-8. Jeśli chcesz, mogę Ci podrzucić...


--------------------
I've fallen in love with the sound... of silence!
Go to the top of the page
 
+Quote Post
zimaq
post 14.1.2006 - 13:05
Post #6


Redaktor
****

Grupa: Redaktor Naczelny
Postów: 185

Nr: 12



Nie jest modny, tylko powoli staje się standardem, który sprawia że sieć jest bardziej... uniwersalna?
Idąc tym tokiem myślenia, lepiej robić strony w HTML 4.01 i nie sprawdzać jak zachowują sie na różnych przeglądarkach, bo przecież validiacja stron i optymizacja jest taka trendy...


--------------------
Go to the top of the page
 
+Quote Post
empiryk
post 14.1.2006 - 17:23
Post #7


aktywność:
**

Grupa: +Bloger
Postów: 42

Nr: 125



CYTAT(pablo @ Jan 14 2006, 08:19 AM)
@empiryk - ale wzbranianie sie przed utf8 tylko dlatego, że teraz uważany jest przez niektórych za modny czy "dżezi" też jest przesadą.
Powiedziałem coś dokładnie przeciwnego. Albo: jest dobrze ustalone, standardowe - czyli powszechnie obowiązujące kodowanie ISO i jego należy się trzymać. W uzasadnionych przypadkach - które wspomniałem - swobodnie można przejść do UTF.

CYTAT(pablo @ Jan 14 2006, 08:19 AM)
Sensowniej jest porównac kodowania pod względem wsparcia dla nich w różnych technologiach programowania, a tym samym ich zastosowań i na tej podstawie wybrać najsensowniejszy dla siebie.
Programowania powiadasz? A kto tu ma na myśli programowanie? Mówimy o dostarczaniu i wyświetlaniu polskojęzycznych treści na dynamicznych stronach WP smile.gif

CYTAT(pablo @ Jan 14 2006, 08:19 AM)
Przy wyborze kodowania w WP oprócz kryterium wielojęzyczności strony widzę jeszcze inne:
-  "pokręcona" konfiguracja serwera baz danych uniemożliwiająca poprawny zapis w takim czy innym kodowaniu;
... czyli źle przygotowany hosting?

CYTAT(pablo @ Jan 14 2006, 08:19 AM)
-  zintegrowanie WP z innymi skryptami, które na utf8 z ogonkami nie zawsze działają dobrze
Tak - to jest dobry przykład. Mam podobny - odnośniki (trackback) przesyłane między serwisami z różnymi kodowaniami mają z zasady popsute ogonki. Ale widzisz: w niczym to nie popiera stosowania UTF, bo dlaczego poprawne kodowanie (ISO) ma być zamienione na inne (UTF) a nie odwrotnie? smile.gif Mam nadzieję, że mnie rozumiesz.
Z twojego i mojego przykładu wynika raczej coś innego: że programista robiący skrypt do odnośników dał ciała, bo nie umie zrobić konwersji z kodowania A do B.


--------------------
GH/P/SS d- s:+ a40 C++ L+ W+++ N++ K- w O-- M-- PS--- PE+ Y+ PGP++ t--- 5-- X++++ R- b++ DI- D-- G e+++ h---- r+++ z+++
Go to the top of the page
 
+Quote Post
zimaq
post 14.1.2006 - 20:13
Post #8


Redaktor
****

Grupa: Redaktor Naczelny
Postów: 185

Nr: 12



CYTAT
Z twojego i mojego przykładu wynika raczej coś innego: że programista robiący skrypt do odnośników dał ciała, bo nie umie zrobić konwersji z kodowania A do B.

Co można łatwo jako plugin dorobić, ale w sumie lepiej dodać do trac'a wordpressa.


--------------------
Go to the top of the page
 
+Quote Post
pablo
post 15.1.2006 - 22:18
Post #9


aktywność:
**

Grupa: +Bloger
Postów: 22

Nr: 9



Może komus sie przyda taka funkacja do przekodowania ISO-8859-2 na UTF-8

KOD
/* ***** Polish (ISO-8859-2) to UTF-8 **********************************
* Copyright (c) 2005 Brian Huisman AKA GreyWyvern - v1.1
* PHP encoding converter from ISO-8859-2 to UTF-8
*
* Modified for PHP from the original Perl as taken from NexTrieve-0.41
* http://backpan.perl.org/authors/id/E/EL/ELIZABETH/NexTrieve-0.41.tar.gz
*
* Copyright (c) 1995-2003 Elizabeth Mattijsen <liz@dijkmat.nl>. All
* rights reserved.
* This program is free software; you can redistribute it and/or modify
* it under the same terms as Perl itself.
********************************************************************* */

function iso88592_2utf8($input) {
 static $iso88592;

 if (!count($iso88592)) $iso88592 = array(
  '', '', '', '', '', '', '', '', '', '',
  '', '', '', '', '', '', '', '', '', '',
  '', '', '', '', '', '', '', '', '', '',
  '', '', ' ', 'Ą', '˘', 'Ł', '¤', 'Ľ', 'Ś', '§',
  '¨', 'Š', 'Ş', 'Ť', 'Ź', '­', 'Ž', 'Ż', '°', 'ą',
  '˛', 'ł', '´', 'ľ', 'ś', 'ˇ', '¸', 'š', 'ş', 'ť',
  'ź', '˝', 'ž', 'ż', 'Ŕ', 'Á', 'Â', 'Ă', 'Ä', 'Ĺ',
  'Ć', 'Ç', 'Č', 'É', 'Ę', 'Ë', 'Ě', 'Í', 'Î', 'Ď',
  'Đ', 'Ń', 'Ň', 'Ó', 'Ô', 'Ő', 'Ö', '×', 'Ř', 'Ů',
  'Ú', 'Ű', 'Ü', 'Ý', 'Ţ', 'ß', 'ŕ', 'á', 'â', 'ă',
  'ä', 'ĺ', 'ć', 'ç', 'č', 'é', 'ę', 'ë', 'ě', 'í',
  'î', 'ď', 'đ', 'ń', 'ň', 'ó', 'ô', 'ő', 'ö', '÷',
  'ř', 'ů', 'ú', 'ű', 'ü', 'ý', 'ţ', '˙');

 return preg_replace("/([\x80-\xFF])/e", '$iso88592[ord($1) - 0x80]', $input);
}


Ja ją wykorzystałem właśnie we wspomnianym extern.php, żeby poprawnie wyświetlać na WP listę ostatnich aktywności z forum (punbb) ktore zapisuje moje dane w iso 8859-2

Ten post edytował pablo 15.1.2006 - 22:19
Go to the top of the page
 
+Quote Post
savek
post 16.1.2006 - 13:13
Post #10


aktywność:
****

Grupa: +Bloger
Postów: 128

Nr: 3



CYTAT(empiryk @ Jan 14 2006, 05:23 PM)
bo dlaczego poprawne kodowanie (ISO) ma być zamienione na inne (UTF) a nie odwrotnie? smile.gif Mam nadzieję, że mnie rozumiesz.
*

zalezy poprawne dla kogo... i jak niby to odwrotne kodowanie ISO zamiast UTF dla innych mialo by dzialac?

Ta cala rozmowa dla mnie traci sens, nie mam zamiaru nikogo przekonywac do czego kolwiek. Dla mnie zastosowanie nowych standardow takich jak CSS2 (oddzielenie tresci od formu), zgodnosc XHTML (wymiana danych), nie budowanie stron na tabelach, kodowanie UTF, ma wymierne korzysci. Nie zauwazylem zebym uzywac czegos tylko dlatego ze jest modne, troche nisko ceni Pan ludzi.


Jak to sie mowi: w sektorze IT kto sie nie rozwija ten sie cofa... tyle.


--------------------
user posted image
Go to the top of the page
 
+Quote Post
zimaq
post 16.1.2006 - 13:49
Post #11


Redaktor
****

Grupa: Redaktor Naczelny
Postów: 185

Nr: 12



CYTAT
Jak to sie mowi: w sektorze IT kto sie nie rozwija ten sie cofa... tyle.

Amen.

Swoją drogą nie tylko w IT smile.gif


--------------------
Go to the top of the page
 
+Quote Post
empiryk
post 16.1.2006 - 14:27
Post #12


aktywność:
**

Grupa: +Bloger
Postów: 42

Nr: 125



CYTAT(savek @ Jan 16 2006, 12:13 PM)
zalezy poprawne dla kogo...
To akurat nie podlega dyskusji - normalizacja ISO. Ustanowiła ISO-8859-2 bodaj w 1987 r.
CYTAT(savek @ Jan 16 2006, 12:13 PM)
Ta cala rozmowa dla mnie traci sens
To mylne wrażenie wink.gif bierze się zapewne stąd, że ten spór obok wymiaru całkiem praktycznego (wspomniane RSSy, czy odnośniki/trackback) ma wymiar ideologiczny - to jest taka mała wojenka starego z nowym - trzeba ją raczej traktować z dystansem smile.gif


--------------------
GH/P/SS d- s:+ a40 C++ L+ W+++ N++ K- w O-- M-- PS--- PE+ Y+ PGP++ t--- 5-- X++++ R- b++ DI- D-- G e+++ h---- r+++ z+++
Go to the top of the page
 
+Quote Post
savek
post 17.1.2006 - 01:27
Post #13


aktywność:
****

Grupa: +Bloger
Postów: 128

Nr: 3



CYTAT
To akurat nie podlega dyskusji - normalizacja ISO. Ustanowiła ISO-8859-2 bodaj w 1987 r.
No tak to wiem ale chdzilo mi raczej dla kogo ... z znaczeniu technicznym (uwarunkowanie geograficzne) oraz zastosowanie. Polskie ISO to 8852-2. Ile mamy jeszcze odmian ISO ? Całkiem sporo. Unicode jest jeden wspolny.

CYTAT
trzeba ją raczej traktować z dystansem

w pelni sie z Panem zgadzam smile.gif


--------------------
user posted image
Go to the top of the page
 
+Quote Post
west28
post 25.2.2006 - 17:51
Post #14


aktywność:
*******

Grupa: Redakcja
Postów: 902

Nr: 309



CYTAT(Mlody @ 13.1.2006 [16:03)
]
savek - jak w notepad zapiszesz jako UTF to wtedy pojawiają się błedy na stronie, więc tak nie da rady zrobić przynajmniej w WP.
*

W notedpad zamień w menu kodowanie z ASCII na Utf-8......


--------------------
Go to the top of the page
 
+Quote Post
blinkkin
post 22.4.2006 - 09:02
Post #15


aktywność:
**

Grupa: +Bloger
Postów: 47

Nr: 449



Mały offtopic: Wiecie skąd pochodzi standart kodowania UTF-8? Został stworzony na potrzebny systemu operacyjnego Plan 9 przez Kena Thomsona i Rob Pike. Warto przeczytać ciekawą historię:

http://www.cl.cam.ac.uk/~mgk25/ucs/utf-8-history.txt


--------------------
Im większe kłamstwo, tym ludzie łatwiej w nie uwierzą.
Go to the top of the page
 
+Quote Post

2 Stron V   1 2 >
Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



Wersja Lo-Fi Aktualny czas: 22 11 08 - 09:43
Polski Blogger | Forum Komputerowe | Spotkania blogerów