He visto muchos mensajes sobre esto pero no muchas respuestas útiles.
Como estoy empezando un proyecto sobre esto, pensé en detallar el proyecto a medida que sucede, ya que puede ayudar a otros.
Estamos migrando nuestro Data Warehouse a Amazon Redshift. Estamos utilizando Data Services para cargar los datos y Webbi para ejecutar informes desde allí.
Comenzaré por lo que ya he hecho.
En primer lugar, intentar cargar datos directamente en Redshift es muy lento y no lo recomiendo, ni es la forma sugerida de hacerlo. Quieres incorporar Amazon S3 como punto de partida.
La última versión de DS 4.2 tiene un controlador nativo para S3. Configura un bucket y comienza tu carga allí. Utilizamos CDC, por lo que estamos cargando nuestros datos cambiados en S3. La diferencia entre esto y el ODBC en Redshift fue la siguiente. Tal vez 100 filas por segundo con suerte en el ODBC. 300,000 a 400,000 por segundo en S3. Una vez que los datos estén allí, puedes configurarlos para copiar a Redshift desde dentro de Amazon. Si todo lo que quieres es llevar los datos a Redshift, entonces aquí has terminado y funciona muy bien. Además, el S3 no es muy caro.
Si estás utilizando Redshift como tu Data Warehouse, continúa leyendo.
Una vez que los datos estén en S3, cópialos a Redshift. Hemos hecho esto y funciona bien.
Estoy en proceso de obtener el ODBC de SAP que viene con las herramientas de BI, ya que el ODBC nativo de Redshift no es 100% compatible (lo que significa que no todo en DS funciona a través de él).
Espero que con el ODBC de SAP esto mejore. Mi objetivo es poder ejecutar todo el SQL para no tener que alojar DS en Amazon. Agregaré más información después de haber probado esta parte.