Marco Schmidt | 5 May 2004 21:15
Picon

Re: historische Zuordnungen

On Wed, 05 May 2004 20:34:55 +0200, you wrote:

>> - Dann mit einem Texteditor (ich verwende eine UTF-16-Textdatei)
>> diesen im Hexadezimal-Modus eingeben.
>
>ich würde einfach UTF-8 verwenden; unter GNU/Linux kann man das meiste
>per cut-and-paste und z.b. mit 'recode' auf der kommandozeile in einem
>UTF-8-xterm erledigen:

UTF-16-Textdateien mit Byte-Order-Marker (BOM) werden von einigen
Programmen automatisch erkannt. Bei UTF-8 gibt es das wohl auch
<http://en.wikipedia.org/wiki/Byte_Order_Mark>, ist aber nicht so
verbreitet. Da ich relativ kleine Dateien habe ist mir das bißchen
Verschwendung egal.

Mir ist auch wichtig, daß ich mit Java solche Dateien einlesen kann.
InputStreamReader in = new InputStreamReader(in, "UTF-16"); wird
soweit ich weiß immer unterstützt, bei UTF-8 mit BOM bin ich mir nicht
so sicher.

Gruß,
Marco

--

-- 
Mailingliste OpenGeoDB
Listenadresse: opengeodb@...
Informationen: http://opengeodb.de
Mit freundlicher Unterstütztung von php::bar (http://phpbar.de)

(Continue reading)

Karl Eichwalder | 5 May 2004 22:24
Picon

Re: historische Zuordnungen

Marco Schmidt <marcoschmidt@...> writes:

> Bei UTF-8 gibt es das wohl auch
> <http://en.wikipedia.org/wiki/Byte_Order_Mark>, ist aber nicht so
> verbreitet.

der BOM stört bei UTF-8 eher; vgl.

    http://www.cl.cam.ac.uk/~mgk25/unicode.html#ucsutf

--

-- 
                                                         |      ,__o
                                                         |    _-\_<,
http://www.gnu.franken.de/ke/                            |   (*)/'(*)
Lutz Rutemöller | 5 May 2004 23:55
Picon

Re: historische Zuordnungen

Danke für die Infos bzgl. Unicode.

--
http://nachhilfe-pilot.de/ - Die online Nachhilfe-Datenbank!
"Lutz Rutemöller" <webmaster@...>
Marco Schmidt | 5 May 2004 21:17
Picon

Re: historische Zuordnungen

On Wed, 05 May 2004 21:15:03 +0200, you wrote:

>Mir ist auch wichtig, daß ich mit Java solche Dateien einlesen kann.
>InputStreamReader in = new InputStreamReader(in, "UTF-16"); wird
>soweit ich weiß immer unterstützt, bei UTF-8 mit BOM bin ich mir nicht
>so sicher.

Der erste Parameter des Konstruktors darf natürlich nicht auch "in"
heißen. Irgendein InputStream-Objekt muß da hin, falls jemand damit
rumspielen will.

Gruß,
Marco

--

-- 
Mailingliste OpenGeoDB
Listenadresse: opengeodb@...
Informationen: http://opengeodb.de
Mit freundlicher Unterstütztung von php::bar (http://phpbar.de)


Gmane