La forma más rápida y sencilla de empezar a usar ClickHouse es crear un nuevo servicio en ClickHouse Cloud. En esta guía de inicio rápido, lo configurarás en tres sencillos pasos.
Crear un servicio de ClickHouse
Para crear un servicio gratuito de ClickHouse en ClickHouse Cloud, solo tienes que registrarte siguiendo estos pasos:- Crea una cuenta en la página de registro
- Puedes registrarte con tu correo electrónico o mediante Google SSO, Microsoft SSO, AWS Marketplace, Google Cloud o Microsoft Azure
- Si te registras con correo electrónico y contraseña, recuerda verificar tu dirección de correo en las siguientes 24 h mediante el enlace que recibirás por correo
- Inicia sesión con el nombre de usuario y la contraseña que acabas de crear
Una vez que hayas iniciado sesión, ClickHouse Cloud inicia el asistente de configuración inicial, que te guía para crear un nuevo servicio de ClickHouse. Selecciona la región en la que quieres desplegar el servicio y asígnale un nombre a tu nuevo servicio:
De forma predeterminada, las nuevas organizaciones se crean en el nivel Scale y tendrán 3 réplicas, cada una con 4 vCPU y 16 GiB de RAM. Vertical autoscaling estará habilitado de forma predeterminada en el nivel Scale. Puedes cambiar el nivel de la organización más adelante en la página ‘Planes’.Si es necesario, personaliza los recursos del servicio especificando un tamaño mínimo y máximo entre los que podrán escalar las réplicas. Cuando esté todo listo, selecciona
Create service.¡Enhorabuena! Tu servicio de ClickHouse Cloud ya está en funcionamiento y la configuración inicial se ha completado. Sigue leyendo para conocer cómo empezar a ingestar y consultar tus datos.
Conéctate a ClickHouse
Hay 2 formas de conectarte a ClickHouse:- Conéctate usando nuestra consola SQL basada en web
- Conéctate con tu aplicación
Conéctate usando la consola SQL
Para empezar rápidamente, ClickHouse ofrece una consola SQL basada en web a la que se te redirigirá al completar el onboarding.Crea una pestaña de consulta e introduce una consulta sencilla para verificar que la conexión funciona:Eso es todo: ¡ya puedes empezar a usar tu nuevo servicio de ClickHouse!
Conéctate con tu aplicación
Haz clic en el botón Connect del menú de navegación. Se abrirá una ventana modal con las credenciales de tu servicio y una serie de instrucciones sobre cómo conectarte mediante tu interfaz o los clients de tu lenguaje.Si no encuentras el client para tu lenguaje, quizá quieras consultar nuestra lista de Integrations.
Agregar datos
¡ClickHouse es mejor con datos! Existen múltiples formas de agregar datos y la mayoría están disponibles en la página de Fuentes de datos, a la que se puede acceder desde el menú de navegación.Puede cargar datos mediante los siguientes métodos:
- Configure un ClickPipe para empezar a ingestar datos de fuentes como S3, Postgres, Kafka y GCS
- Usa la consola SQL
- Use el cliente de ClickHouse
- Sube un archivo - los formatos admitidos incluyen JSON, CSV y TSV
- Cargar datos desde la URL del archivo
ClickPipes
ClickPipes es una plataforma de integración administrada que simplifica la ingesta de datos desde un conjunto diverso de fuentes con solo unos pocos clics. Diseñada para los workloads más exigentes, la arquitectura robusta y escalable de ClickPipes garantiza un rendimiento y una fiabilidad consistentes. ClickPipes puede utilizarse tanto para necesidades de streaming a largo plazo como para trabajos puntuales de carga de datos.Agregar datos mediante la SQL Console
Como la mayoría de los sistemas de gestión de bases de datos, ClickHouse agrupa lógicamente las tablas en bases de datos. Use el comandoCREATE DATABASE para crear una nueva base de datos en ClickHouse:my_first_table en la base de datos helloworld:my_first_table es una tabla MergeTree con cuatro columnas:user_id: un entero sin signo de 32 bits (UInt32)message: un tipo de dato String que sustituye tipos comoVARCHAR,BLOB,CLOBy otros de otros sistemas de bases de datostimestamp: un valor DateTime que representa un instante en el tiempometric: un número de coma flotante de 32 bits (Float32)
Motores de tablaLos motores de tabla determinan:
Hay muchos motores de tabla entre los que elegir, pero para una tabla sencilla en un servidor ClickHouse de un solo nodo,
- Cómo y dónde se almacenan los datos
- Qué consultas se admiten
- Si los datos se replican o no
Hay muchos motores de tabla entre los que elegir, pero para una tabla sencilla en un servidor ClickHouse de un solo nodo,
MergeTree será probablemente la opción más adecuada.Breve introducción a las claves primarias
Antes de continuar, es importante entender cómo funcionan las claves primarias en ClickHouse (¡la implementación de las claves primarias puede resultar sorprendente!):- las claves primarias de ClickHouse no son únicas para cada fila de una tabla
SELECT.La clave primaria puede definirse mediante el parámetro PRIMARY KEY. Si se define una tabla sin especificar un PRIMARY KEY,
la clave pasa a ser la tupla indicada en la cláusula ORDER BY. Si se especifican tanto PRIMARY KEY como ORDER BY, la clave primaria debe ser un subconjunto del orden de ordenación.La clave primaria es también la clave de ordenación, que es una tupla de (user_id, timestamp). Por lo tanto, los datos almacenados en cada
archivo de columna estarán ordenados por user_id y, a continuación, por timestamp.Para profundizar en los conceptos fundamentales de ClickHouse, consulte “Conceptos fundamentales”.Insertar datos en tu tabla
Puede utilizar el conocido comandoINSERT INTO TABLE con ClickHouse, pero es importante entender que cada inserción en una tabla MergeTree genera la creación de una parte en el almacenamiento.Incluso para un ejemplo sencillo, insertemos más de una fila a la vez:
Observa que la columna
timestamp se rellena mediante varias funciones de Date y DateTime. ClickHouse tiene cientos de funciones útiles que puedes consultar en la sección Funciones.Agregar datos con el ClickHouse Client
También puede conectarse a su servicio de ClickHouse Cloud mediante una herramienta de línea de comandos llamada clickhouse client. Haga clic enConnect en el menú de la izquierda para acceder a estos detalles. En el cuadro de diálogo, seleccione Native en el menú desplegable:- Instala ClickHouse.
- Ejecute el comando sustituyendo su hostname, username y password:
- Pruébelo ejecutando la siguiente consulta:
- Agregue una cláusula
FORMATpara especificar uno de los numerosos formatos de salida que admite ClickHouse:
- Para salir del
clickhouse client, escriba el comando exit:
Cargar un archivo
Una tarea habitual al comenzar a trabajar con una base de datos es insertar datos que ya se tienen en archivos. Disponemos de datos de muestra en línea que puede insertar y que representan datos de clickstream; incluyen un ID de usuario, una URL visitada y el timestamp del evento.Supongamos que tenemos el siguiente texto en un archivo CSV llamadodata.csv:data.csv
- El siguiente comando inserta los datos en
my_first_table:
- Observa que las nuevas filas ya aparecen en la tabla al consultar desde la SQL Console:
¿Qué sigue?
- El Tutorial te guía para insertar 2 millones de filas en una tabla y escribir algunas consultas analíticas
- Tenemos una lista de datasets de ejemplo con instrucciones sobre cómo insertarlos
- Consulta nuestro video de 25 minutos sobre Primeros pasos con ClickHouse
- Si tus datos provienen de una fuente externa, consulta nuestra colección de guías de integración para conectarte a colas de mensajes, bases de datos, canalizaciones y mucho más
- Si usas una herramienta de visualización o BI, consulta las guías de usuario para conectar una UI a ClickHouse
- La guía de usuario sobre claves primarias contiene todo lo que necesitas saber sobre las claves primarias y cómo definirlas