>Concorsi
>Forum
>Bandi/G.U.
 
 
 
 
  Login |  Registrati 
Elenco in ordine alfabetico delle domande di Big data

Seleziona l'iniziale:
A   B   C   D   E   F   G   H   I   J   K   L   M   N   O   P   Q   R   S   T   U   V   W   X   Y   Z  

> Clicca qui per scaricare l'elenco completo delle domande di questo argomento in formato Word!


Qual è l'API Java di alto livello più popolare nell'ecosistema Hadoop?   Cascading .
Quale "package" contiene le funzioni fondamentali del linguaggio "R"?   Base.
Quale dei seguenti approcci dovrebbe essere utilizzato per porre domande nel campo dell'analisi dei dati (Data Analysis)?   Individuare la/le domande a cui si deve trovare la risposta.
Quale dei seguenti e' un importante linguaggio nell'ambito della Data Science?   R.
Quale dei seguenti passaggi viene, normalmente, eseguito dal data scientist dopo aver acquisito i dati?   Pulizia dei dati.
Quale dei seguenti prodotti commerciali non può essere considerato tra le data analytics platforms disponibili sul mercato?   SAP.
Quale dei seguenti strumenti può essere utilizzato per l'elaborazione batch di dati e operazioni di aggregazione?   MapReduce.
Quale delle seguenti affermazioni, riferite al linguaggio "R", è sbagliata?   R funziona solo in ambiente Windows.
Quale delle seguenti caratteristiche dei big data è più rilevante nel contesto "data science"?   Varietà.
Quale delle seguenti competenze sono cruciali per un data scientist?   Matematica e rappresentazione grafica dei dati.
Quale delle seguenti definizioni descrive meglio la scienza dei dati o Data Science?   La scienza dei dati è l'insieme di principi metodologici e di tecniche multidisciplinari che ha l'obiettivo di interpretare ed estrarre conoscenza dai dati attraverso la relativa fase di analisi da parte di un esperto.
Quale delle seguenti definizioni descrive meglio le caratteristiche di un "data scientist"?   Un "Data Scientist" deve essere in grado di generare "business value" dalla raccolta inteligente di dati e dalla loro analisi, cioe' deve avere competenze nel settore di business dell'azienda, di statistica, software engineering e data communication.
Quale delle seguenti definizioni meglio descrive una "Data Analytics Platform"?   Una "data analytics platform" ha l'obbiettivo di fornire in un unico strumento un set completo di strumenti per l'analisi di grandi quantita' di dati anche in real time.
Quale delle seguenti operazioni è più rilevante nel lavoro del Data Scientist?   Definire la/le domande da farsi.
Quale delle seguenti operazioni si concentra sulla scoperta di proprietà (precedentemente) sconosciute dei dati?   data mining.
Quale delle seguenti sono competenze chiave di un data scientist?   Statistica, Machine Learning, Data Visualisation.
Quale tra le seguenti affermazioni NON è corretta?   Il modello di programmazione, MapReduce, utilizzato da Hadoop, è difficile da scrivere e testare.
Quale tra questi è l'architettura deputata alla raccolta e all'utilizzo dei Big Data?   Data Lake
Quale tra questi è un framework per il disegno e l'implementazione di architetture Big Data?   Lambda architecture
Quale, delle seguenti affermazioni relative ad "R", è corretta?   R è un linguaggio di programmazione e un ambiente software gratuito per il calcolo statistico e la grafica supportati dalla R Foundation for Statistical Computing.
Quale, tra i moduli che compongono il framework Hadoop, è un file-system distribuito, fornendo una larghezza di banda aggregata molto elevata in tutto il cluster?   HDFS.
Quale, tra i moduli che compongono il framework Hadoop, contiene librerie e utilità necessarie per altri moduli Hadoop?   Hadoop Common.
Quale, tra i moduli che compongono il framework Hadoop, fornisce una piattaforma per la gestione delle risorse di elaborazione in cluster e del loro utilizzo per la pianificazione delle applicazioni degli utenti?   Hadoop YARN.
Quale, tra i seguenti, è l'ultimo modulo aggiunto (2020) all'Apache Hadoop framework?   Hadoop Ozone.
Quale, tra i seguenti, è un modello di calcolo general- purpose ed un sistema runtime per l'analisi dei dati in ambiente distribuito?   Mapreduce.
Quale, tra i seguenti, è un modello di programmazione utilizzato per sviluppare applicazioni basate su Hadoop che possono processare enormi quantità di dati??   MapReducce.
Quale, tra le seguenti affermazioni, NON è corretta?   Elastic MapReduce (EMR) è l'offerta Hadoop in pacchetto di Facebook.
Quale, tra le seguenti caratteristiche riferite ad Hadoop, non è corretta?   Real time.
Quale, tra le seguenti società al momento, ha il più grande cluster Hadoop al mondo?   Facebook.
Quale, tra le seguenti, è la prima attività che viene normalmente eseguita da un data scientist sui dati che gli vengono forniti?   Data Cleansing.
Quale, tra le seguenti, è una piattaforma di alto livello per creare programmi MapReduce da usare con Apache Hadoop?   Pig.
Quali sono i livelli che presenta la lambda architecture?   Batch layer - speed layer - serving layer
Quali sono le fasi di vita dei Big Data?   Acquisizione (o Data ingestion), immagazzinamento e organizzazione, trasformazione e analisi
Quali sono le sei fasi principali in cui CRISP-DM (Cross- industry standard process for data mining ) suddivide il processo di data mining?   Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation, Deployment.
Quali, tra le seguenti sono competenze importanti per un data scientist?   Statistica, Machine Learning, Visualizzazione dei dati.
Quanti livelli presenta la lambda architecture?   3