Disco: massive data, minimal code

21-07-2010 11:00 - Fonte: www.ossblog.it

Disco è una piattaforma open source per l’analisi di una gran quantità di dati. Il framework supporta l’esecuzione parallela su normali computer di più computazioni su insiemi di dati molto grandi. Supporta varie implementazioni fra cui anche il sistema MapReduce. Il nucleo di Disco è scritto in Erlang, un linguaggio che ben si adatta alla creazione di applicazioni distribuite e fault-tolerant. Gli utenti della piattaforma possono scrivere i propri job da eseguire in Python rendendo molto rapido lo sviluppo di programmi che gestiscono una grande mole di dati. Questo progetto è nato nel Nokia Research Center come per rendere più facile la gestione del calcolo distribuito. Da allora è stato usato in molti ambiti: parsing, analisi di log, data mining, full-text indexing, modelli probabilistici, machine learning ed altro ancora. Via | DiscoProject Disco: massive data, minimal code é stato pubblicato su ossblog alle 11:00 di mercoledì 21 luglio 2010.

- Continua...