RetroSearch Browse

Home - News ( United States | United Kingdom | Italy | Germany ) - Football scores

Showing content from https://developer.mozilla.org/de/docs/Web/API/TextEncoder/encodeInto below:

TextEncoder: encodeInto() Methode - Web-APIs

TextEncoder: encodeInto() Methode

Baseline Widely available

Hinweis: Diese Funktion ist in Web Workers verfÃ¼gbar.

Die TextEncoder.encodeInto() Methode nimmt einen zu kodierenden String und ein Ziel-Uint8Array, um den resultierenden UTF-8 kodierten Text hineinzugeben, und gibt ein Objekt zurÃ¼ck, das den Fortschritt der Kodierung anzeigt. Dies ist potenziell leistungsfÃ¤higer als die encode() Methode â insbesondere wenn der Zielpuffer eine Ansicht in einen Wasm Speicherbereich ist.

Syntax

encodeInto(string, uint8Array)

Parameter

string: Ein String, der den zu kodierenden Text enthÃ¤lt.
uint8Array: Eine Uint8Array-Objektinstanz, in die der resultierende UTF-8 kodierte Text eingefÃ¼gt wird.

RÃ¼ckgabewert

Ein Objekt, das zwei Mitglieder enthÃ¤lt:

read: Die Anzahl der UTF-16 Code-Einheiten aus der Quelle, die in UTF-8 umgewandelt wurden. Dies kann kleiner als string.length sein, wenn uint8Array nicht genÃ¼gend Platz hatte.
written: Die Anzahl der modifizierten Bytes im Ziel-Uint8Array. Die geschriebenen Bytes bilden garantiert vollstÃ¤ndige UTF-8-Bytesequenzen.

In eine bestimmte Position kodieren

encodeInto() legt seine Ausgabe immer am Anfang des Arrays ab. Es ist jedoch manchmal nÃ¼tzlich, die Ausgabe an einem bestimmten Index zu starten. Die LÃ¶sung ist TypedArray.prototype.subarray():

const encoder = new TextEncoder();

function encodeIntoAtPosition(string, u8array, position) {
  return encoder.encodeInto(
    string,
    position ? u8array.subarray(position | 0) : u8array,
  );
}

const u8array = new Uint8Array(8);
encodeIntoAtPosition("hello", u8array, 2);
console.log(u8array.join()); // 0,0,104,101,108,108,111,0

PuffergrÃ¶Ãe

Um einen JavaScript-String s zu konvertieren, darf der fÃ¼r die vollstÃ¤ndige Konvertierung benÃ¶tigte Ausgabespeicher nie kleiner als s.length Bytes und nie grÃ¶Ãer als s.length * 3 Bytes sein. Das genaue UTF-8-zu-UTF-16-LÃ¤ngenverhÃ¤ltnis fÃ¼r Ihren String hÃ¤ngt von der Sprache ab, mit der Sie arbeiten:

FÃ¼r einfachen englischen Text, der hauptsÃ¤chlich ASCII-Zeichen verwendet, liegt das VerhÃ¤ltnis nahe bei 1.
FÃ¼r Texte in Schriftsystemen, die Zeichen von U+0080 bis U+07FF verwenden, darunter Griechisch, Kyrillisch, HebrÃ¤isch, Arabisch etc., liegt das VerhÃ¤ltnis bei etwa 2.
FÃ¼r Texte in Schriftsystemen, die Zeichen von U+0800 bis U+FFFF verwenden, darunter Chinesisch, Japanisch, Koreanisch etc., betrÃ¤gt das VerhÃ¤ltnis etwa 3.
Es ist nicht Ã¼blich, dass ganze Schriftsysteme in Nicht-BMP-Zeichen geschrieben werden (obwohl sie existieren). Diese Zeichen sind normalerweise mathematische Symbole, Emojis, historische Schriften etc. Das VerhÃ¤ltnis fÃ¼r diese Zeichen betrÃ¤gt 2, da sie 4 Bytes in UTF-8 und 2 in UTF-16 benÃ¶tigen.

Wenn die Ausgabezuordnung (typischerweise innerhalb des Wasm-Speicherbereichs) voraussichtlich kurzlebig ist, ist es sinnvoll, s.length * 3 Bytes fÃ¼r die Ausgabe zu reservieren, in diesem Fall ist der erste Umwandlungsversuch garantiert, den ganzen String zu konvertieren.

Wenn Ihr Text hauptsÃ¤chlich Englisch ist, ist es unwahrscheinlich, dass langer Text die LÃ¤nge von s.length * 2 Bytes Ã¼berschreitet. Daher kÃ¶nnte ein optimistischerer Ansatz darin bestehen, s.length * 2 + 5 Bytes zu reservieren und bei der seltenen Gelegenheit, dass die optimistische Vorhersage falsch war, eine Neuzuordnung durchzufÃ¼hren.

Wenn die Ausgabe voraussichtlich langlebig ist, wÃ¤re es sinnvoll, eine minimale Zuordnung roundUpToBucketSize(s.length), die maximale ZuordnungsgrÃ¶Ãe s.length * 3 zu berechnen und einen (als Kompromiss zwischen Speicherverbrauch und Geschwindigkeit) Schwellenwert t zu haben, sodass Sie, wenn roundUpToBucketSize(s.length) + t >= s.length * 3, fÃ¼r s.length * 3 reservieren. Andernfalls reservieren Sie zunÃ¤chst fÃ¼r roundUpToBucketSize(s.length) und konvertieren. Falls der read-Eintrag im RÃ¼ckgabewÃ¶rterbuch s.length betrÃ¤gt, ist die Konvertierung abgeschlossen. Falls nicht, reservieren Sie den Zielpuffer fÃ¼r written + (s.length - read) * 3 neu und konvertieren dann den Rest, indem Sie einen Teilstring von s ab dem Index read und einen Teilpuffer des Zielpuffers ab dem Index written verwenden.

Oben ist roundUpToBucketSize(), eine Funktion, die auf die Bucket-GrÃ¶Ãe des Allokators aufrundet. Wenn beispielsweise Ihr Wasm-Allokator bekannt ist, Potenzen von zwei zu verwenden, sollte roundUpToBucketSize() das Argument zurÃ¼ckgeben, wenn es eine Potenz von zwei ist oder die nÃ¤chste Potenz von zwei andernfalls. Wenn das Verhalten des Wasm-Allokators unbekannt ist, sollte roundUpToBucketSize() eine IdentitÃ¤tsfunktion sein.

Wenn das Verhalten Ihres Allokators unbekannt ist, mÃ¶chten Sie mÃ¶glicherweise bis zu zwei Neuzuordnungsschritte haben und den ersten Neuzuordnungsschritt die restliche unkonvertierte LÃ¤nge mal zwei anstelle von drei multiplizieren lassen. In diesem Fall macht es jedoch Sinn, das Ã¼bliche Multiplizieren mit zwei der bereits geschriebenen PufferspeicherlÃ¤nge nicht zu implementieren, denn wenn eine zweite Neuzuweisung stattgefunden hat, wÃ¼rde sie im Vergleich zur ursprÃ¼nglichen LÃ¤nge mal drei stets Ã¼berallokieren. Der obige Rat setzt voraus, dass Sie keinen Speicherplatz fÃ¼r ein Null-Terminierungszeichen benÃ¶tigen. Das bedeutet, dass auf der Wasm-Seite mit Rust-Strings oder einer nicht-nullterminierenden C++-Klasse gearbeitet wird. Wenn Sie mit C++ std::string arbeiten, mÃ¼ssen Sie, auch wenn die logische LÃ¤nge angezeigt wird, das zusÃ¤tzliche Terminierungsbyte berÃ¼cksichtigen, wenn Sie das Aufrunden zur Bucket-GrÃ¶Ãe des Allokators berechnen. Siehe den nÃ¤chsten Abschnitt Ã¼ber C-Strings.

Keine Null-Terminierung

Wenn der Eingabestring das Zeichen U+0000 enthÃ¤lt, wird encodeInto() ein 0x00-Byte in der Ausgabe schreiben. encodeInto() schreibt nicht ein C-Ã¤hnliches 0x00-Sentinel-Byte nach der logischen Ausgabe.

Wenn Ihr Wasm-Programm C-Strings verwendet, liegt es in Ihrer Verantwortung, das 0x00-Sentinel zu schreiben, und Sie kÃ¶nnen nicht verhindern, dass Ihr Wasm-Programm einen logisch abgeschnittenen String sieht, wenn der JavaScript-String U+0000 enthielt. Beobachten Sie:

const encoder = new TextEncoder();

function encodeIntoWithSentinel(string, u8array, position) {
  const stats = encoder.encodeInto(
    string,
    position ? u8array.subarray(position | 0) : u8array,
  );
  if (stats.written < u8array.length) u8array[stats.written] = 0; // append null if room
  return stats;
}

Beispiele Kodierung in einen Puffer

<p class="source">This is a sample paragraph.</p>
<p class="result"></p>

const sourcePara = document.querySelector(".source");
const resultPara = document.querySelector(".result");
const string = sourcePara.textContent;

const textEncoder = new TextEncoder();
const utf8 = new Uint8Array(string.length);

const encodedResults = textEncoder.encodeInto(string, utf8);
resultPara.textContent +=
  `Bytes read: ${encodedResults.read}` +
  ` | Bytes written: ${encodedResults.written}` +
  ` | Encoded result: ${utf8}`;

Spezifikationen Browser-KompatibilitÃ¤t Siehe auch

Das TextEncoder-Interface, zu dem es gehÃ¶rt.
TextEncoder.encode()

RetroSearch is an open source project built by @garambo | Open a GitHub Issue

Search and Browse the WWW like it's 1997 | Search results from DuckDuckGo

HTML: 3.2 | Encoding: UTF-8 | Version: 0.7.4