Este capÃtulo presenta cómo trabajar con cadenas de caracteres (String
) y texto en JavaScript.
String
)
El tipo String de JavaScript se utiliza para representar datos textuales. Es un conjunto de "elementos" de valores enteros sin signo de 16 bits (unidades de código UTF-16). Cada elemento de la cadena de caracteres ocupa una posición en la cadena. El primer elemento está en el Ãndice 0, el siguiente en el Ãndice 1, y asà sucesivamente. La longitud de una cadena es el número de elementos que contiene. Puedes crear cadenas utilizando cadena literales u objetos string.
PRECAUCIÃN: si editas esta página, no incluyas ningún caracter por encima de U+FFFF, hasta que se solucione el (Error 857438 en Firefox de MDN).
Cadenas literalesPuedes crear cadenas simples utilizando comillas simples o dobles:
Se pueden crear cadenas más avanzadas usando secuencias de escape:
Secuencias de escape hexadecimalesEl número después de \x se interpreta como un número del Sistema_hexadecimal.
Secuencias de escape UnicodeLas secuencias de escape Unicode requieren al menos cuatro dÃgitos hexadecimales después de \u
.
Nuevo en ECMAScript 2015. Con el código de puntos de escape Unicode, cualquier carácter se puede escapar usando números hexadecimales para que sea posible usar puntos de código Unicode hasta 0x10FFFF
. Con simples escapes Unicode, a menudo es necesario escribir las mitades sustitutas por separado para lograr el mismo resultado.
Consulta también String.fromCodePoint()
o String.prototype.codePointAt()
.
"\u{2F804}";
// lo mismo con los escapes Unicode simples
"\uD87E\uDC04";
Objetos String
El objeto String
es una envoltura alrededor del tipo de dato primitivo string
.
const foo = new String("foo"); // Crea un objeto String
console.log(foo); // Muestra: [String: 'foo']
typeof foo; // Devuelve 'object'
Puedes llamar a cualquiera de los métodos del objeto String
en un valor de cadena literal: JavaScript automáticamente convierte la cadena literal en un objeto String
temporal, llama al método y luego descarta el objeto String
temporal. También puedes usar la propiedad String.length
con una cadena literal:
Debes usar cadenas literales a menos que necesites especÃficamente usar un objeto String
, porque los objetos String
pueden tener un comportamiento contrario a la intuición. Por ejemplo:
const firstString = "2 + 2"; // Crea un valor de cadena literal
const secondString = new String("2 + 2"); // Crea un objeto String
eval(firstString); // Devuelve el número 4
eval(secondString); // Devuelve la cadena "2 + 2"
Un objeto String
tiene una propiedad, length
, que indica el número de unidades de código UTF-16 en la cadena. Por ejemplo, el siguiente código asigna a helloLength
el valor 13, porque "¡Hola, mundo!" tiene 13 caracteres, cada uno representado por una unidad de código UTF-16. Puedes acceder a cada unidad de código utilizando la notación de corchete de los arreglos. No puedes cambiar caracteres individuales porque las cadenas son objetos inmutables similares a los arreglos:
const hello = "¡Hola, mundo!";
const helloLength = hello.length;
hello[0] = "L"; // Esto no tiene ningún efecto, porque las cadenas son inmutables
hello[1]; // Esto devuelve "H"
Los caracteres cuyos valores escalares Unicode son mayores que U+FFFF (tal como algunos caracteres chinos/japoneses/coreanos/vietnamitas raros y algunos «emoji»s) se almacenan en UTF-16 con dos unidades de código sustituto cada uno. Por ejemplo, una cadena que contenga el caracter único U+1F600 "Cara sonriente de emoji" tendrá una longitud de 2. El acceso a las unidades de código individual en una cadena de este tipo utilizando corchetes puede tener consecuencias indeseables, como la formación de cadenas con diferentes unidades de código suplente, violando el estándar Unicode. (Se deben agregar ejemplos a esta página después de que se corrija el error MDN Error 857438 en Firefox). Consulta también String.fromCodePoint()
o String.prototype.codePointAt()
.
Un objeto String
tiene una variedad de métodos: por ejemplo, aquellos que devuelven una variación de la cadena en sÃ, como substring
y toUpperCase
.
La siguiente tabla resume los métodos de los objetos String
.
charAt
, charCodeAt
, codePointAt
Devuelve el caracter o código de caracter en la posición especificada en la cadena. indexOf
, lastIndexOf
Devuelve la posición de la subcadena especificada en la cadena o la última posición de la subcadena especificada, respectivamente. startsWith
, endsWith
, includes
Devuelve si o no la cadena comienza, termina o contiene una subcadena especificada. concat
Combina el texto de dos cadenas y devuelve una nueva cadena. fromCharCode
, fromCodePoint
Construye una cadena a partir de la secuencia especificada de valores Unicode. Este es un método de la clase String
, no una instancia de String
. split
Divide un objeto String
en un arreglo de cadenas separando la cadena en subcadenas. slice
Extrae una sección de una cadena y devuelve una nueva cadena. substring
, substr
Devuelve el subconjunto especificado de la cadena, ya sea especificando los Ãndices inicial y final o el Ãndice inicial y una longitud. match
, matchAll
, replace
, replaceAll
, search
Trabaja con expresiones regulares. toLowerCase
, toUpperCase
Devuelve la cadena en minúsculas o mayúsculas, respectivamente. normalize
Devuelve la forma de normalización Unicode del valor de la cadena llamada. repeat
Devuelve una cadena que consta de los elementos del objeto repetidos las veces indicadas. trim
Recorta los espacios en blanco desde el principio y el final de la cadena. Plantillas literales multilÃnea
Las plantillas literales
son cadena literales que permiten expresiones incrustadas. Puedes utilizar cadenas de varias lÃneas y funciones de interpolación de cadenas con ellas.
Las plantillas literales están encerradas por el carácter (``
) (acento grave) en lugar de comillas simples o dobles. Las plantillas literales pueden contener marcadores de posición. Estos se indican mediante el signo de dólar y llaves (${expresión}
).
Cualquier caracter de nueva lÃnea insertado en la fuente es parte de la plantilla literal. Usando cadenas normales, tendrÃas que usar la siguiente sintaxis para obtener cadenas multilÃnea:
console.log(
"cadena de texto lÃnea 1\n\
cadena de texto lÃnea 2",
);
// "cadena de texto lÃnea 1
// cadena de texto lÃnea 2"
Para obtener el mismo efecto con cadenas multilÃnea, ahora puedes escribir:
console.log(`cadena de texto lÃnea 1
cadena de texto lÃnea 2`);
// "cadena de texto lÃnea 1
// cadena de texto lÃnea 2"
Expresiones incrustadas
Para incrustar expresiones dentro de cadenas normales, usarÃas la siguiente sintaxis:
const five = 5;
const ten = 10;
console.log("Quince es " + (five + ten) + " y no " + (2 * five + ten) + ".");
// "Quince es 15 y no 20."
Ahora, con las plantillas literales, puedes hacer uso del azúcar sintáctica haciendo que las sustituciones como esta sean más legibles:
const five = 5;
const ten = 10;
console.log(`Quince es ${five + ten} y no ${2 * five + ten}.`);
// "Quince es 15 y no 20."
Para obtener más información, lee acerca de plantillas literales
en la Referencia de JavaScript
.
El objeto Intl
es el espacio de nombres para la API de internacionalización de ECMAScript, que proporciona comparación de cadenas sensible al idioma, formato de números y formato de fecha y hora. Los constructores de los objetos Collator
, NumberFormat
y DateTimeFormat
son propiedades del objeto Intl
.
El objeto DateTimeFormat
es útil para formatear la fecha y la hora. El siguiente formato es una fecha para el Inglés como se usa en los Estados Unidos. (El resultado es diferente en otra zona horaria).
const msPerDay = 24 * 60 * 60 * 1000;
// July 17, 2014 00:00:00 UTC.
const july172014 = new Date(msPerDay * (44 * 365 + 11 + 197));
const options = {
year: "2-digit",
month: "2-digit",
day: "2-digit",
hour: "2-digit",
minute: "2-digit",
timeZoneName: "short",
};
const americanDateTime = new Intl.DateTimeFormat("en-US", options).format;
console.log(americanDateTime(july172014)); // 07/16/14, 5:00 PM PDT
Formato de número
El objeto NumberFormat
es útil para formatear números, por ejemplo, monedas.
const gasPrice = new Intl.NumberFormat("en-US", {
style: "currency",
currency: "USD",
minimumFractionDigits: 3,
});
console.log(gasPrice.format(5.259)); // $5.259
const hanDecimalRMBInChina = new Intl.NumberFormat("zh-CN-u-nu-hanidec", {
style: "currency",
currency: "CNY",
});
console.log(hanDecimalRMBInChina.format(1314.25)); // ï¿¥ ä¸,ä¸ä¸å.äºäº
Colación
El objeto Collator
es útil para comparar y ordenar cadenas.
Por ejemplo, en realidad hay dos órdenes de clasificación diferentes en Alemán, «phonebook» y «dictionary». La clasificación «phonebook» enfatiza el sonido, y es como si "ä", "ö", etc. se expandieran a "ae", "oe", etc. antes de la clasificación.
const names = ["Hochberg", "Hönigswald", "Holzman"];
const germanPhonebook = new Intl.Collator("de-DE-u-co-phonebk");
// como ordenando ["Hochberg", "Hoenigswald", "Holzman"]:
console.log(names.sort(germanPhonebook.compare).join(", "));
// registra "Hochberg, Hönigswald, Holzman"
Algunas palabras alemanas se conjugan con diéresis adicionales, por lo que en los diccionarios es sensato ordenar ignorando diéresis (excepto cuando se ordenan palabras que difieren solo por las diéresis: «schon» antes de «schön»).
const germanDictionary = new Intl.Collator("de-DE-u-co-dict");
// como si ordenara ["Hochberg", "Honigswald", "Holzman"]:
console.log(names.sort(germanDictionary.compare).join(", "));
// registra "Hochberg, Holzman, Hönigswald"
Para obtener más información sobre la API de Intl
, consulta también la Introducción a la API de internacionalización de JavaScript.
RetroSearch is an open source project built by @garambo | Open a GitHub Issue
Search and Browse the WWW like it's 1997 | Search results from DuckDuckGo
HTML:
3.2
| Encoding:
UTF-8
| Version:
0.7.4