Gerenciamento de dados VARCHAR e NVARCHAR no SAP Hana: Erros comuns e recomendações

Crear

Creado 01/03/2024
Modificado 01/03/2024
28 Vistas

Ayer tuve una discusión sobre los tipos de datos VARCHAR y NVARCHAR y su manejo en Hana. A primera vista todo está claro: usar VARCHAR solo para caracteres ASCII (inglés), todo lo demás debe usar NVARCHAR. La pregunta fue ¿qué sucede cuando se utiliza VARCHAR por accidente?

Aquí un ejemplo: Creo una tabla, inserto dos filas, selecciono de ella y todo parece estar perfectamente bien.

La primera indicación de que hay diferencias en realidad es cuando agrego otra ciudad que tiene 8 caracteres de longitud. Aquí obtengo un error:

El error está en CITYNAME1, la columna varchar(9). La razón es obvia, ya que el manual de Hana establece que el tipo de datos VARCHAR es solo para caracteres ASCII de 7 bits, pero nuestro texto tiene algunos caracteres no ASCII.

Cuando intento insertar la cadena de 8 caracteres 'Shenzhèn', sus bytes(!) se insertan y debido a los dos caracteres de doble byte, la matriz de bytes tiene una longitud de 10 bytes. No cabe en un VARCHAR(9).

La representación UTF-8 de ese nombre de ciudad es

S  | h  |   e   | n  | z  | h  |   è   | n
  53 | 68 | c4 93 | 6e | 7a | 68 | c3 a8 | 6n

Eso plantea dos preguntas interesantes para el caso de Beijing:

¿Por qué funciona la primera inserción aunque estemos insertando caracteres no ASCII en varchar? ¿No debería generar un error como "¡Oye, eso no es una cadena ASCII!"?

¿Por qué la selección devuelve el texto correcto aunque se lea de un tipo de datos que no puede manejarlo?

Para la primera pregunta argumentaría que sí, debería. Actualmente el enfoque es que un texto se envía a la base de datos y se insertan sus bytes. No se aplica lógica ni pruebas. El texto simplemente se trata como un array de números binarios.

Y eso responde también a la segunda pregunta. Los datos binarios se leen de la base de datos como un flujo de bytes y la mayoría de las herramientas usan el convertidor UTF-8 predeterminado para mostrar el texto, por lo que el texto parece ser correcto. Pero no hay garantía de eso. Otras herramientas mostrarán el texto como una lista de caracteres ASCII y devolverán "BÄ ijÄ«ng" en lugar de "Beijing".

En otras palabras, al insertar el texto "Beijing" en un VARCHAR y seleccionar el valor con la misma herramienta, se comete el mismo error dos veces: convertir texto a binario y binario a texto con la misma conversión, y por lo tanto se anulan entre sí, todo parece estar bien. Pero eso es pura suerte. Otra herramienta podría usar otro conjunto de caracteres predeterminado, especialmente las herramientas nativas de Windows.

Realmente deberías almacenar caracteres ASCII solo en VARCHAR y usar NVARCHAR para todo lo demás.

No ayuda que todas las funciones internas de Hana como length(), substring(), etc. también estén utilizando los valores UTF-8. Para la función length el manual de Hana lo establece explícitamente, para la función substring no lo hace. Dado que UTF-8 y ASCII son idénticos para todos los caracteres del 0 al 127 (7 bits), no se necesita un manejo especial si VARCHAR contiene solo valores ASCII de 7 bits. Pero si no lo hace, estamos en un estado indefinido.

SAP HANA

Pedro Pascal

Se unió el 07/03/2018

Responder

Facebook

Twitter

Sin respuestas

No hay respuestas para mostrar Se el primero en responder

PARA MÁS INFORMACIÓN
INGRESA TUS DATOS

Nombre completo

Correo electrónico

Curso de interés

Celular

Etiquetas más populares

Ver todo

Preguntas más populares

Cómo solucionar el error PCL XL al imprimir desde la transacción VL71 en SAP: Guía paso a paso

Error PCL XL en impresión SAPSolución al error PCL XL en impresión SAPEl error PCL XL que se menciona en el foro parece estar relacionado con problemas de impresión en una transacción específica de...

01/03/2024 · 9K+ Vistas · 1 Respuestas
¿Cuál es la diferencia entre las unidades PC y EA?

Estimado Experto, ¿Podrías por favor decirme amablemente cuál es la diferencia entre las unidades PC y EA? Parece que ambas significan cada una, todas... Gracias...

01/03/2024 · 10K+ Vistas · 2 Respuestas
Generación de Números de Tarjetas de Crédito Válidos para Pruebas: Amplía tus Horizontes de Testing

¿Has estado probando la funcionalidad de tarjetas de pago y alguna vez has pensado en conseguir más datos de prueba (números de tarjetas de crédito válidos) para expandir tus horizontes...

01/03/2024 · 34K+ Vistas · 0 Respuestas
Cómo Imprimir el Importe Total de una Factura en Letras: Ejemplo de Convertir 1500.00 a Mil Quinientos Pesos 00/100 M.N.

Hola ¿Qué tal? ¿Alguien sabe cómo puedo imprimir el importe total de una factura en letras? Ejemplo 1500.00 Mil Quinientos Pesos 00/100 M.N. Saludos...

01/03/2024 · 21K+ Vistas · 4 Respuestas
Cómo evitar y solucionar java.lang.NullPointerException en Java

Hola a todos, ¿Alguien puede decirme sobre java.lang.NullPointerException? Cuándo recibiremos este tipo de error y cómo solucionarlo. Si obtenemos este error, ¿dónde debemo...

01/03/2024 · 17K+ Vistas · 4 Respuestas

Aprende en Comunidad

¡Acceso SAP S/4HANA desde $100!

Gerenciamento de dados VARCHAR e NVARCHAR no SAP Hana: Erros comuns e recomendações

Sin respuestas

PARA MÁS INFORMACIÓN
INGRESA TUS DATOS

Etiquetas más populares

Preguntas más populares

Partners:

Aprende en Comunidad

¡Acceso SAP S/4HANA desde $100!

Gerenciamento de dados VARCHAR e NVARCHAR no SAP Hana: Erros comuns e recomendações

Sin respuestas

PARA MÁS INFORMACIÓNINGRESA TUS DATOS

Etiquetas más populares

Preguntas más populares

Partners:

PARA MÁS INFORMACIÓN
INGRESA TUS DATOS