Il mercato della tecnologia big data sta offrendo il meglio di sé sotto molti aspetti: dai sistemi di registrazione fino all’analitica self-service. Il risultato è che la nuova tipologia di intelligence per il business e le piattaforme di analitica stiano emergendo per andare incontro ai requisiti gestionali delle aziende, ma anche all’accessibilità, all’agilità e ad […]
Il mercato della tecnologia big data sta offrendo il meglio di sé sotto molti aspetti: dai sistemi di registrazione fino all’analitica self-service. Il risultato è che la nuova tipologia di intelligence per il business e le piattaforme di analitica stiano emergendo per andare incontro ai requisiti gestionali delle aziende, ma anche all’accessibilità, all’agilità e ad insight sempre più dettagliati.
Questi sistemi di ultima generazione hanno dato vita a una serie di startup che hanno lavorato al fine di raccogliere, gestire e analizzare i big data, sia strutturati che non strutturati, in movimento oppure statici, ma anche in sede oppure sul cloud.
Ecco la lista delle 10 migliori startup del 2016 in ambito Big Data secondo il sito Crn.
1. Confluent – CEO: Jay Kreps
Lavorare con i dati live e in streaming è una delle sfide più importanti per chi si occupa di big data e analitica. Una tecnologia che sta ridimensionando il problema è l’open source Apache Kafka un progetto che fornisce un software a bassa latenza per gestire i feed dei dati in tempo reale.
Confluent, è stata fondata dagli sviluppatori originali di Apache Kafka e ha creato una piattaforma di dati real-time completa attorno a Kafka, che funge da sistema di messaggistica altamente scalabile. Il software può essere utilizzato per la raccolta dei dati, per i log delle attività degli utenti, per la strumentazione dei dispositivi e un’ampia gamma di scopi ulteriori.
Lo scorso maggio, la società che ha sede a Palo Alto, ha annunciato la disponibilità della piattaforma Confluent 3.0 che incorpora i Kafka Streams per aggiungere capacità di elaborazione in stream e un centro di controllo Confluent che rende operativo Kafka in tutto il sistema.
2. Anodot – CEO: David Drai
Anodot è uscita di soppiatto a novembre del 2015 e ha rivelato il proprio software per l’individuazione delle anomalie in real time, così come dell’intelligence operazionale. Il software si basa su un algoritmo di machine learning brevettato e automatizza l’analitica evidenziando le opportunità di business e i problemi relativi alle performance. L’obiettivo è quello di individuare le anomalie all’interno di quantitativi di dati enormi e di renderli degli insight utili al business.
La tecnologia di Anodot è indirizzata all’utilizzo nei siti di e-commerce, pubblicità digitale e reti IoT per migliorare l’efficienza operazionale e massimizzare la resa economica. La società ha la sue sedi a Ra’Anana in Israele e a Sunnyvale in California. Lo scorso settembre ha raccolto 8 milioni di dollari di finanziamenti.
3. Koverse – CEO: Jon Matsuo
Koverse ha sviluppato una piattaforma data lake in scatola, ovvero, rende possibile raccogliere i big data e metterli in produzione in un tempo molto più breve (e ad un costo inferiore) rispetto alle attuali tecnologie disponibili.
La società ha sede a Seattle ed è stata fondata nel 2012. La prima versione 1.0 di questa tecnologia ha debuttato 2 anni fa. La piattaforma Koverse 2.0, lanciata lo scorso giugno, incorpora Apache Accumulo e l’Universal Indexing Engine di proprietà della stessa Koverse.
I co-fondatori, Paul Brown (CPO) e Aaron Cordova (CTO) avevano già lavorato insieme come data scientist presso l’NSA (National Security Agency) all’interno della quale avevano aiutato a sviluppare il progetto originale Accumulo e avevano architettato quell’infrastruttura di dati per trattare al meglio situazioni di dati analitici impreviste.
4. Maana – CEO: Babur Ozden
Maana sviluppa la Maana Knowledge Platform, un software per la ricerca e la scoperta di dati in grado di raccogliere altri dati da numerosi sistemi o silos e di renderli così un insight operazionale che possa essere utilizzato da applicazioni di business. Il sistema è costruito sulla base del motore di elaborazione Apache Spark.
La società ha sede a Palo Alto ed è stata fondata nel 2012, ma è stata lanciata ufficialmente a maggio del 2015. Si è posizionata molto bene per aver raccolto e analizzato larghi volumi di dati generati dalle reti IoT. A settembre la compagnia ha lanciato l’edizione Winter 17 del proprio prodotto, con delle applicazioni in grado di ottimizzare i processi di business come le catene di fornitura e la gestione dei call center, ma anche degli assistenti capaci di creare nuovi modelli analitici.
Lo scorso maggio la società è riuscita a raccogliere 26 milioni di dollari in finanziamenti e la maggior parte sono stati ottenuti dai clienti del settore petrolifero e industriale come Shell, Chevron, Saudi Aramco, Intel e General Electric.
5. Pachyderm – CEO: Joe Doliner
La startup Pachyderm ha sviluppato un motore di analitica open-source che utilizza i contenitori Docker per eseguire computazioni distribuite. Punta ad offrire una struttura di analisi dei dati di tipo containerizzato, modulare e scalabile, attraverso strumenti come Docker e Kubernetes.
I software Pachyderm File System e il Pachyderm Pipeline System aiutano i gestori dei dati e gli analisti a costruire canali di machine learning e di flussi di lavoro di dati ETL (estrazione, trasformazione e carico)
Fondata nel 2014 – con base a San Francisco – la Pachyderm ha raccolto 2 milioni di finanziamenti a giugno.
6. StreamSets – CEO: Girish Pancha
StreamSets è un’altra società che si mette in gioco nella sfida della gestione dei dati in movimento. Più precisamente, si tratta di una startup che sviluppa un software per sorvegliare e prevenire il problema del data drift, ovvero dispersione dei dati, una mutazione non prevedibile che crea problemi con le applicazioni che utilizzano quei dati.
Il software StreamSets Data Collector viene utilizzato per costruire dati complessi tra qualsiasi fonte di dati e qualsiasi apllicazione che ne abbia bisogno. Lo scorso settembre la startup ha fatto debuttare il proprio StreamSets Dataflow Performance Manager che si occupa di gestione delle operazioni di dataflow.
Ha sede a San Francisco ed è stata fondata nel 2014 dal CEO Girish Pancha, ex CPO di Informatica, e dal CTO Arvind Prabhakar, un ingegnere di Cloudera.
7. Striim – President and CEO: Ali Kutay
Striim – che si pronuncia come stream in inglese e ha due “i” perché una sta per integrazione e l’altra per intelligence – è stata fondata nel 2012 dagli executive della Golden Gate Software, Oracle, Informatica, WebLogic e altri nomi famosi tra le società di gestione dei dati.
La società ha sede a Palo Alto e unisce in un unico sistema l’integrazione di dati in streaming con intelligence operazionale in streaming, consentendo così elaborazione continua e analitica in streaming. Lo scorso novembre la compagnia ha rilasciato una nuova versione del proprio software che lavora con Google Big Query Kafka e MapR Technologies.
Striim ha raccolto 10 milioni di dollari in finanziamenti aggiuntivi lo scorso marzo, portando il finanziamento complessivo della startup a circa 30 milioni di dollari.
8. Stytch – CEO: Mark Cunningham
Stytch ha fatto debuttare la propria piattaforma di analitica end to end lo scorso aprile, offrendo in un unico sistema degli strumenti per la preparazione di dati self-service, modellazione, scoperta, report e dashboard. Stytch è sostenuta dalla Dun & Bradstreet.
La startup ha base a Vancouver ed è stata lanciata ad Agosto del 2015. Il fondatore e CEO Mark Cunningham lavora dal 1992 nell’industria di business intelligence.
9. Talena – CEO: Nitin Donde
Talena fornisce software di management di big data in grado di aiutare le imprese a proteggere gli asset dei dati di valore e iterare rapidamente le applicazioni critiche di business. La tecnologia di questa società fornisce sia backup che recovery, gestione di test e sviluppo, ma anche archiviazione via Hadoop, NoSQL e Cassandra e Couchbase, oltre a Vertica di Hewlett Packard Enterprise.
A Marzo la Talena ha presentato ActiveRx, infrastruttura di analisi predittiva per la gestione dei compiti big data. Il software punta ad incorporare il machine learning alla disposnibilità dei dati predittivi e a rendere i dati di back up degli asset di dati attivi.
10. Waterline Data – CEO: Alex Gorelik
La sfida più significativa per chiunque si occupi di big data rimane trovare un uso significativo dei dati stessi e di gestirli in modo semplificato.
La Waterline Data indirizza questo problema con il proprio software Smart Data Catalog che costruisce un inventario di asset di dati, migliorando la scoperta dei dati e la gestione degli stessi, al fine di semplificare le operazioni di business rendendole proficue.
Fondata nel 2013 a Mountain View, in California, la Waterline Data ha raccolto 16 milioni di finanziamenti a gennaio.