Ero UCS-2 ja UTF-16



UCS-2 vs UTF-16

UCS-2 ja UTF-16 on kaksi merkistöä käyttäviä 2 tavua, joka koostuu 16 bittiä edustamaan kunkin merkin; jolloin 2 ja 16 päätteitä. Suurin ero UCS-2 ja UTF-16 on kumpi käytetään tänään. UCS-2 on vanhempi järjestelmä, joka on sittemmin katsoa vanhentuneiksi ja korvataan paljon uudempia ja tehokkaampia UTF-16.

UCS-2 on kiinteä leveys koodaus, joka käyttää kahta tavua kunkin merkin; mikä tarkoittaa, se voi olla jopa yhteensä 216 merkkiä tai hieman yli 65 tuhatta euroa. Toisaalta, UTF-16 on vaihteleva leveys, joka koodaa järjestelmä, joka käyttää vähintään 2 tavua ja enintään 4 tavua kunkin merkin. Tämä mahdollistaa UTF-16 edustaa mitä tahansa merkkiä Unicode käytettäessä mahdollisimman vähän tilaa yleisimmin käytetty merkkiä. Sillä suurin osa 65.000 merkkiä, UCS-2 ja UTF-16 on sama koodi pistettä; joten ne ovat suurelta osin vastaavia. Tämä mahdollistaa UTF-16 kykenee sovelluksia tulkita oikein UCS-2-koodit. Mutta toisinpäin ei toimi, koska monet parannukset UTF-16.

Yksi mainitun parannuksia on kyky edustaa skriptejä, jotka menevät oikealta vasemmalle pikemmin kuin vasemmalta oikealle. UTF-16 komentosarjat voidaan tunnistaa suuntaavuus, jolloin sovellus oikein tehdä sanat, jotka on tallennettu koodi. UCS-2 puuttuu tämä kyky näin ei toimi skriptejä kuten arabian ja heprean, jotka liikkuvat oikealta vasemmalle. Toinen ominaisuus, joka UTF-16 on on normalisointi. Normalisointi kohtelee sanoja, jotka tarkoittavat samaa asiaa, mutta esitetään eri identtisiksi. Esimerkiksi ilmaisu 'voi' ja 'voi' t 'ovat samat, koska jälkimmäinen on vain supistuminen entisen. Tämä on erittäin tärkeää, varsinkin kun etsit sellaisia ​​sanoja, koska se mahdollistaisi entistä kattava haku tuloksena. In UCS-2, tämä ei tapahdu automaattisesti, joten sovelluksen täytyy toteuttaa tällainen ominaisuus omasta.



Ei todellakaan mitään syytä valita UCS-2 yli UTF-16, syrjään saamasta hakemusta sinun ei tue UTF-16. Kaikessa, UTF-16 on parempi kuin UCS-2. Se on myös suurelta osin taaksepäin yhteensopiva, joten sinun ei tarvitse huolehtia pakatun UCS-2.

Yhteenveto:

UCS-2 on vanhentunut ja on sittemmin korvattu UTF-16

UCS-2 on kiinteä leveys merkistöllä taas UTF-16 on vaihteleva leveys merkistöllä

UTF-16 kykenee sovellukset voivat lukea UCS-2-tiedostoja, mutta ei toisinpäin

UTF-16 tukee oikeus antaa skriptejä kun UCS-2 ei