Baseline 2024
Newly available
Das Intl.Segmenter
-Objekt ermöglicht eine lokalisierungssensitive Textsegmentierung, mit der Sie bedeutungsvolle Elemente (Grapheme, Wörter oder Sätze) aus einer Zeichenkette erhalten können.
const segmenterFr = new Intl.Segmenter("fr", { granularity: "word" });
const string = "Que ma joie demeure";
const iterator = segmenterFr.segment(string)[Symbol.iterator]();
console.log(iterator.next().value.segment);
// Expected output: 'Que'
console.log(iterator.next().value.segment);
// Expected output: ' '
Konstruktor
Intl.Segmenter()
Erstellt ein neues Intl.Segmenter
-Objekt.
Intl.Segmenter.supportedLocalesOf()
Gibt ein Array zurück, das diejenigen der angegebenen Sprachstandorte enthält, die unterstützt werden, ohne auf die Standard-Spracheinstellung der Laufzeitumgebung zurückzugreifen.
Diese Eigenschaften sind auf Intl.Segmenter.prototype
definiert und werden von allen Intl.Segmenter
-Instanzen geteilt.
Intl.Segmenter.prototype.constructor
Die Konstruktorfunktion, die das Instanzobjekt erstellt hat. Für Intl.Segmenter
-Instanzen ist der Anfangswert der Intl.Segmenter
-Konstruktor.
Intl.Segmenter.prototype[Symbol.toStringTag]
Der Anfangswert der [Symbol.toStringTag]
-Eigenschaft ist die Zeichenfolge "Intl.Segmenter"
. Diese Eigenschaft wird in Object.prototype.toString()
verwendet.
Intl.Segmenter.prototype.resolvedOptions()
Gibt ein neues Objekt mit Eigenschaften zurück, die die Sprach- und Granularitätsoptionen widerspiegeln, die während der Initialisierung dieses Intl.Segmenter
-Objekts berechnet wurden.
Intl.Segmenter.prototype.segment()
Gibt eine neue iterierbare Segments
-Instanz zurück, die die Segmente einer Zeichenkette gemäà der Spracheinstellung und Granularität dieser Intl.Segmenter
-Instanz darstellt.
Wenn wir String.prototype.split(" ")
verwenden würden, um einen Text in Wörter zu segmentieren, würden wir kein korrektes Ergebnis erhalten, wenn der Sprachraum des Textes keine Leerzeichen zwischen Wörtern verwendet (was für Japanisch, Chinesisch, Thailändisch, Laotisch, Khmer, Myanmar usw. der Fall ist).
const str = "å¾è¼©ã¯ç«ã§ãããååã¯ãã¬ãã";
console.table(str.split(" "));
// ['å¾è¼©ã¯ç«ã§ãããååã¯ãã¬ãã']
// The two sentences are not correctly segmented.
const str = "å¾è¼©ã¯ç«ã§ãããååã¯ãã¬ãã";
const segmenterJa = new Intl.Segmenter("ja-JP", { granularity: "word" });
const segments = segmenterJa.segment(str);
console.table(Array.from(segments));
// [{segment: 'å¾è¼©', index: 0, input: 'å¾è¼©ã¯ç«ã§ãããååã¯ãã¬ãã', isWordLike: true},
// etc.
// ]
Spezifikationen Browser-Kompatibilität Siehe auch
RetroSearch is an open source project built by @garambo | Open a GitHub Issue
Search and Browse the WWW like it's 1997 | Search results from DuckDuckGo
HTML:
3.2
| Encoding:
UTF-8
| Version:
0.7.4