Ο όγκος δεδομένων που συλλέγει κάθε μέρα το Facebook, είναι τεράστιος, εάν αναλογιστεί κανείς ότι έχει 950 εκατομμύρια χρήστες οι οποίοι καθημερινά και για 6,5 ώρες κατα μέσο όρο τον μήνα κάνουν like, ανοίγουν τις ειδοποιήσεις τους, ανεβάζουν φωτογραφίες, επισκέπτονται group κλπ. Όλες αυτές οι ενέργειες, δημιουργούν δεδομένα τα οποία πηγαίνουν κατευθείαν στην εταιρία και στα υπερσύγχρονα datacenter της.
Σύμφωνα με τα στατιστικά χρήσης που έδωσε στη δημοσιότητα το κοινωνικό δίκτυο, κάθε μέρα οι χρήστες του κάνουν 2.7 δισεκατομμύρια likes, μοιράζονται 2.5 δισεκατομμύρια status, posts, φωτογραφίες, video και σχόλια ενώ κάθε μέρα ανεβάζουν στο Facebook 300 εκατομμύρια φωτογραφίες.
Όλα αυτά έχουν σαν αποτέλεσμα την δημιουργία περισσότερων από 500 terrabyte δεδομένων κάθε ημέρα και την πραγματοποίηση 70.000 queries. Όλα αυτά αναλύονται μέσω του Hive, της ψηφιακής γλώσσας εξέτασης του Facebook σε ρυθμό 105 terrabyte κάθε μισή ώρα.
«Αν δεν εκμεταλλεύεσαι τα πολλά δεδομένα» είπε ο Jay Parikh, Αντιπρόεδρος υποδομών του Facebook, «τότε δεν έχεις πολλά δεδομένα, έχεις απλά ένα σωρό δεδομένων. Είπε ακόμα πως η εταιρεία μονίμως ψάχνει τρόπους για το πώς μπορεί να αναλύσει και να ερμηνεύσει τα δεδομένα αυτά για να συμπληρώσει πως το Facebook μπορεί να μεγαλώνει γρήγορα, αλλά όλοι οι υπόλοιποι μεγαλώνουν γρηγορότερα.