BlinkDB

Agarwal, Sameer; Mozafari, Barzan; Panda, Aurojit; Milner, Henry; Madden, Samuel; Stoica, Ion

doi:10.1145/2465351.2465355

articleApr 15, 2013Closed access

BlinkDB

SASameer Agarwal BMBarzan Mozafari APAurojit Panda HMHenry Milner SMSamuel Madden

University of California, Berkeley · Massachusetts Institute of Technology

Indexed incrossref

Abstract

In this paper, we present BlinkDB, a massively parallel, approximate query engine for running interactive SQL queries on large volumes of data. BlinkDB allows users to trade-off query accuracy for response time, enabling interactive queries over massive data by running queries on data samples and presenting results annotated with meaningful error bars. To achieve this, BlinkDB uses two key ideas: (1) an adaptive optimization framework that builds and maintains a set of multi-dimensional stratified samples from original data over time, and (2) a dynamic sample selection strategy that selects an appropriately sized sample based on a query's accuracy or response time requirements. We evaluate BlinkDB against the…

Citation impact

708

total citations

FWCI: 67.29
Percentile: 100%
References: 40

Citations per year

Authors

6

Topics & keywords

Topics

Keywords

Computer science
SQL
Workload
Node (physics)
Set (abstract data type)
Sample (material)
Key (lock)
Query optimization

No related works found for this paper.