mirror of https://github.com/scylladb/scylladb.git synced 2026-05-22 15:52:13 +00:00

Go to file

Avi Kivity fce124bd90 Merge "Introduce flat_mutation_reader_v2" from Tomasz

"
This series introduces a new version of the mutation fragment stream (called v2)
which aims at improving range tombstone handling in the system.

When compacting a mutation fragment stream (e.g. for sstable compaction, data query, repair),
the compactor needs to accumulate range tombstones which are relevant for the yet-to-be-processed range.
See range_tombstone_accumulator. One problem is that it has unbounded memory footprint because the
accumulator needs to keep track of all the tombstoned ranges which are still active.

Another, although more benign, problem is computational complexity needed to maintain that data structure.

The fix is to get rid of the overlap of range tombstones in the mutation fragment stream. In v2 of the
stream, there is no longer a range_tombstone fragment. Deletions of ranges of rows within a given
partition are represented with range_tombstone_change fragments. At any point in the stream there
is a single active clustered tombstone. It is initially equal to the neutral tombstone when the
stream of each partition starts. The range_tombstone_change fragment type signify changes of the
active clustered tombstone. All fragments emitted while a given clustered tombstone is active are
affected by that tombstone. Like with the old range_tombstone fragments, the clustered tombstone
is independent from the partition tombstone carried in partition_start.

The memory needed to compact a stream is now constant, because the compactor needs to only track the
current tombstone. Also, there is no need to expire ranges on each fragment because the stream emits
a fragment when the range ends.

This series doesn't convert all readers to v2. It introduces adaptors which can convert
between v1 and v2 streams. Each mutation source can be constructed with either v1 or v2 stream factory,
but it can be asked any version, performing conversion under the hood if necessary.

In order to guarantee that v1 to v2 conversion produces a well-formed stream, this series needs to
impose a constraint on v1 streams to trim range tombstones to clustering restrictions. Otherwise,
v1->v2 converted could produce range tombstone changes which lie outside query restrictions, making
the stream non-canonical.

The v2 stream is strict about range tombstone trimming. It emits range tombstone changes which reflect
range tombstones trimmed to query restrictions, and fast-forwarding ranges. This makes the stream
more canonical, meaning that for a given set of writes, querying the database should produce the
same stream of fragments for a given restrictions. There is less ambiguity in how the writes
are represented in the fragment stream. It wasn't the case with v1. For example, A given set
of deletions could be produced either as one range_tombstone, or may, split and/or deoverlapped
with other fragments. Making a stream canonical is easier for diff-calculating.

The mc sstable reader was converted to v2 because it seemed like a comparable effort to do that
versus implementing range tombstone trimming in v1.

The classes related to mutation fragment streams were cloned:
flat_mutation_reader_v2, mutation_fragment_v2, related concepts.

Refs #8625. To fully fix #8625 we need to finish the transition and get rid of the converters.
Converters accumulate range tombstones.

Tests:

 - unit [dev]
"

* tag 'flat_mutation_reader_range_tombstone_split-v3.2' of github.com:tgrabiec/scylla: (26 commits)
  tests: mutation_source_test: Run tests with conversions inserted in the middle
  tests: mutation_source_tests: Unroll run_flat_mutation_reader_tests()
  tests: Add tests for flat_mutation_reader_v2
  flat_mutation_reader: Update the doc to reflect range tombstone trimming
  sstables: Switch the mx reader to flat_mutation_reader_v2
  row_cache: Emit range tombstone adjacent to upper bound of population range
  tests: sstables: Fix test assertions to not expect more than they should
  flat_mutation_reader: Trim range tombstones in make_flat_mutation_reader_from_fragments()
  clustering_ranges_walker: Emit range tombstone changes while walking
  tests: flat_mutation_reader_assertions_v2: Adapt to the v2 stream
  Clone flat_reader_assertions into flat_reader_assertions_v2
  test: lib: simple_schema: Reuse new_tombstone()
  test: lib: simple_schema: Accept tombstone in delete_range()
  mutation_source: Introduce make_reader_v2()
  partition_snapshot_flat_reader: Trim range tombstones to query ranges
  mutation_partition: Trim range tombstones to query ranges
  sstables: reader: Inline specialization of sstable_mutation_reader
  sstables: k_l: reader: Trim range tombstones to query ranges
  clustering_ranges_walker: Introduce split_tombstone()
  position_range: Introduce contains() check for ranges
  ...

2021-06-16 11:10:54 +03:00

.github

docs: added multiversion_regex_builder

2021-01-13 11:07:29 +02:00

abseil @ 9c6a50fdd8

Update abseil submodule

2021-02-08 15:41:46 +02:00

alternator

alternator: Move start-stop code into controller

2021-06-11 18:17:27 +03:00

api

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

auth

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

cdc

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

conf

config: relax batch size warning and failure thresholds

2021-04-06 20:56:06 +03:00

cql3

cql: create_keyspace_statement: move logger out of header file

2021-06-13 14:45:40 +03:00

view: fix use-after-move when handling view update failures

2021-06-14 09:36:10 +02:00

debug

…

dht

Merge 'dht: token: make some cosmetic changes' from Michał Chojnowski

2021-06-07 15:41:15 +03:00

dist

dist: rpm: Add specific versioning and python3 dependency

2021-06-09 20:02:43 +03:00

docs

docs/guides/debugging.md: expand section on libthread-db

2021-06-12 21:36:47 +03:00

exceptions

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

gms

gossiper: Set minimum value for quarantine_delay

2021-06-16 09:34:49 +02:00

idl

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

index

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

interface

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

libdeflate @ e7e54eab42

Update libdeflate submodule

2018-12-03 11:18:02 +02:00

licenses

Add abseil as a submodule

2020-06-14 08:18:37 -07:00

locator

Merge 'locator: token_metadata: simplify tokens_iterator' from Michał Chojnowski

2021-06-08 15:42:41 +03:00

message

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

mutation_writer

flat_mutation_reader: unify reader_consumer declarations

2021-06-07 16:11:18 +03:00

raft

raft: register metrics only after fsm is created

2021-06-16 09:34:49 +02:00

redis

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

reloc

reloc: Remove "build_reloc.sh" script as obsolete

2020-11-20 22:41:26 +02:00

repair

repair: get_sharder_for_tables: throw no_such_column_family

2021-06-08 14:45:44 +03:00

scripts

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

seastar @ 813eee3e4e

Update seastar submodule

2021-06-14 10:27:14 +03:00

service

storage_service: Add node_ops_cmd_heartbeat_updater helper

2021-06-16 09:34:49 +02:00

sstables

sstables: Switch the mx reader to flat_mutation_reader_v2

2021-06-16 00:23:49 +02:00

streaming

Merge 'streaming: make_streaming_consumer: close reader on errors' from Benny Halevy

2021-06-09 15:02:36 +03:00

swagger-ui @ 12f1da1082

…

test

Merge "Introduce flat_mutation_reader_v2" from Tomasz

2021-06-16 11:10:54 +03:00

thrift

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

tools

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

tracing

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

transport

transport: Untie transport and database

2021-06-09 20:04:12 +03:00

types

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

unified

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

utils

Merge "Remove int_or_strong_ordering concept" from Pavel

2021-06-16 09:34:49 +02:00

.dockerignore

.dockerignore: add testlog

2020-02-07 08:59:39 +01:00

.gitattributes

…

.gitignore

docs: added theme

2020-12-03 17:37:18 +01:00

.gitmodules

scylla-python3: move scylla-python3 to separated repository

2020-08-18 09:34:08 +03:00

.gitorderfile

…

absl-flat_hash_map.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

absl-flat_hash_map.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

atomic_cell_hash.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

atomic_cell_or_collection.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

atomic_cell.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

atomic_cell.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

backlog_controller.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

bytes_ostream.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

bytes.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

bytes.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

cache_flat_mutation_reader.hh

row_cache: Emit range tombstone adjacent to upper bound of population range

2021-06-16 00:23:49 +02:00

cache_temperature.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

caching_options.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

caching_options.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

canonical_mutation.cc

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

canonical_mutation.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

cartesian_product.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

cell_locking.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

checked-file-impl.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

clocks-impl.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

clocks-impl.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

clustering_bounds_comparator.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

clustering_interval_set.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

clustering_key_filter.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

clustering_ranges_walker.hh

clustering_ranges_walker: Emit range tombstone changes while walking

2021-06-16 00:23:49 +02:00

CMakeLists.txt

db: Add virtual tables interface

2021-05-12 17:05:34 +02:00

collection_mutation.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

collection_mutation.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

column_computation.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

combine.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

compaction_garbage_collector.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

compaction_strategy_type.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

compaction_strategy.hh

flat_mutation_reader: unify reader_consumer declarations

2021-06-07 16:11:18 +03:00

compatible_ring_position.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

compound_compat.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

compound.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

compress.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

compress.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

concrete_types.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

configure.py

alternator: Controller basement

2021-06-11 18:06:10 +03:00

connection_notifier.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

connection_notifier.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

CONTRIBUTING.md

CONTRIBUTING.md: add the requirement for self-contained headers

2021-05-05 15:10:46 +03:00

converting_mutation_partition_applier.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

converting_mutation_partition_applier.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

counters.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

counters.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

cql_serialization_format.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

database_fwd.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

database.cc

database: Fix warning about deprecated update_shares_for_class usage

2021-06-14 10:42:22 +03:00

database.hh

repair: get_sharder_for_tables: throw no_such_column_family

2021-06-08 14:45:44 +03:00

db_clock.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

debug.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

default.nix

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

digest_algorithm.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

digester.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

dirty_memory_manager.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

distributed_loader.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

distributed_loader.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

Doxyfile

…

duration.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

duration.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

encoding_stats.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

enum_set.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

fix_system_distributed_tables.py

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

flat_mutation_reader_v2.hh

flat_mutation_reader_v2: Implement read_mutation_from_flat_mutation_reader()

2021-06-15 13:14:45 +02:00

flat_mutation_reader.cc

flat_mutation_reader: Trim range tombstones in make_flat_mutation_reader_from_fragments()

2021-06-16 00:23:49 +02:00

flat_mutation_reader.hh

flat_mutation_reader: Update the doc to reflect range tombstone trimming

2021-06-16 00:23:49 +02:00

frozen_mutation.cc

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

frozen_mutation.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

frozen_schema.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

frozen_schema.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

gc_clock.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

gen_segmented_compress_params.py

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

generic_server.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

generic_server.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

HACKING.md

HACKING.md: redirect to ./coverage.py for more details

2021-05-21 11:50:39 +03:00

hashers.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

hashers.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

hashing_partition_visitor.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

hashing.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

idl-compiler.py

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

inet_address_vectors.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

init.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

init.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

install-dependencies.sh

build: drop lld from install-dependencies.sh on s390x

2021-04-12 09:46:33 +03:00

install.sh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

interval.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

intrusive_set_external_comparator.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

keys.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

keys.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

LICENSE.AGPL

…

lister.cc

codebase wide: replace count with contains

2020-08-15 20:26:02 +03:00

lister.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

log.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

lua.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

lua.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

main.cc

main: use correct max-io-requests option spelling

2021-06-16 09:35:05 +02:00

map_difference.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

marshal_exception.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

memtable-sstable.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

memtable.cc

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

memtable.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

multishard_mutation_query.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

multishard_mutation_query.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

mutation_cleaner.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

mutation_compactor.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

mutation_consumer_concepts.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

mutation_fragment_stream_validator.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

mutation_fragment_v2.hh

Adapt flat_mutation_reader_v2 to the new version of the API

2021-06-15 13:10:47 +02:00

mutation_fragment.cc

Adapt flat_mutation_reader_v2 to the new version of the API

2021-06-15 13:10:47 +02:00

mutation_fragment.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

mutation_partition_serializer.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

mutation_partition_serializer.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

mutation_partition_view.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

mutation_partition_view.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

mutation_partition_visitor.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

mutation_partition.cc

mutation_partition: Trim range tombstones to query ranges

2021-06-16 00:23:49 +02:00

mutation_partition.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

mutation_query.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

mutation_query.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

mutation_reader.cc

mutation_reader: foreign_reader::close() use on_internal_error_noexcept()

2021-06-16 09:34:49 +02:00

mutation_reader.hh

mutation_source: Introduce make_reader_v2()

2021-06-16 00:23:49 +02:00

mutation_rebuilder.hh

flat_mutation_reader_v2: Implement read_mutation_from_flat_mutation_reader()

2021-06-15 13:14:45 +02:00

mutation_source_metadata.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

mutation.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

mutation.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

noexcept_traits.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

NOTICE.txt

raft: etcd unit tests: initial boost tests

2021-01-18 12:33:12 -04:00

ORIGIN

…

partition_builder.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

partition_range_compat.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

partition_slice_builder.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

partition_slice_builder.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

partition_snapshot_reader.hh

partition_snapshot_flat_reader: Trim range tombstones to query ranges

2021-06-16 00:23:49 +02:00

partition_snapshot_row_cursor.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

partition_version_list.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

partition_version.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

partition_version.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

position_in_partition.hh

sstables: k_l: reader: Trim range tombstones to query ranges

2021-06-15 13:14:45 +02:00

querier.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

querier.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

query_class_config.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

query_result_merger.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

query-request.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

query-result-reader.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

query-result-set.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

query-result-set.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

query-result-writer.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

query-result.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

query.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

range_tombstone_assembler.hh

flat_mutation_reader: Introduce adaptors between v1 and v2 of mutation fragment stream

2021-06-15 13:10:47 +02:00

range_tombstone_change_generator.hh

flat_mutation_reader: Introduce adaptors between v1 and v2 of mutation fragment stream

2021-06-15 13:10:47 +02:00

range_tombstone_list.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

range_tombstone_list.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

range_tombstone_splitter.hh

flat_mutation_reader: Trim range tombstones in make_flat_mutation_reader_from_fragments()

2021-06-16 00:23:49 +02:00

range_tombstone.cc

Adapt flat_mutation_reader_v2 to the new version of the API

2021-06-15 13:10:47 +02:00

range_tombstone.hh

range_tombstone: Introduce trim()

2021-06-15 13:14:45 +02:00

range.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

read_context.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

reader_concurrency_semaphore.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

reader_concurrency_semaphore.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

reader_permit.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

README.md

docs: fix invalid path in README.mds

2021-02-21 13:49:12 +02:00

real_dirty_memory_accounter.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

release.cc

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

release.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

reversibly_mergeable.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

row_cache.cc

row_cache: count range tombstones processed during read

2021-06-14 14:29:05 +02:00

row_cache.hh

row_cache: count range tombstones processed during read

2021-06-14 14:29:05 +02:00

schema_builder.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

schema_fwd.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

schema_mutations.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

schema_mutations.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

schema_registry.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

schema_registry.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

schema_upgrader.hh

Adapt flat_mutation_reader_v2 to the new version of the API

2021-06-15 13:10:47 +02:00

schema.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

schema.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

scylla_post_install.sh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

scylla-gdb.py

sstables: reader: Inline specialization of sstable_mutation_reader

2021-06-16 00:23:49 +02:00

SCYLLA-VERSION-GEN

version: prepare for the 4.6 cycle

2021-04-01 20:40:52 +03:00

seastarx.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

serialization_visitors.hh

…

serializer_impl.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

serializer.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

serializer.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

service_permit.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

setup.py

…

shell.nix

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

supervisor.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

table_helper.cc

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

table_helper.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

table.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

test.py

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

timeout_config.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

timeout_config.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

timestamp.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

to_string.hh

to_string: Add formatter for strong_ordering

2021-06-08 11:33:04 +03:00

tombstone.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

tox.ini

…

types.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

types.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

ubsan-suppressions.supp

suppress ubsan error in boost::deque::clear()

2020-11-09 11:25:19 +02:00

unimplemented.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

unimplemented.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

user_types_metadata.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

validation.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

validation.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

version.hh

treewide: reduce header interdependencies

2021-06-07 15:58:35 +03:00

view_info.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

vint-serialization.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

vint-serialization.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

xx_hasher.hh

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

zstd.cc

treewide: extent copyright statements to present day

2021-06-06 19:18:49 +03:00

README.md

Scylla

What is Scylla?

Scylla is the real-time big data database that is API-compatible with Apache Cassandra and Amazon DynamoDB. Scylla embraces a shared-nothing approach that increases throughput and storage capacity to realize order-of-magnitude performance improvements and reduce hardware costs.

For more information, please see the ScyllaDB web site.

Build Prerequisites

Scylla is fairly fussy about its build environment, requiring very recent versions of the C++20 compiler and of many libraries to build. The document HACKING.md includes detailed information on building and developing Scylla, but to get Scylla building quickly on (almost) any build machine, Scylla offers a frozen toolchain, This is a pre-configured Docker image which includes recent versions of all the required compilers, libraries and build tools. Using the frozen toolchain allows you to avoid changing anything in your build machine to meet Scylla's requirements - you just need to meet the frozen toolchain's prerequisites (mostly, Docker or Podman being available).

Building Scylla

Building Scylla with the frozen toolchain dbuild is as easy as:

$ git submodule update --init --force --recursive
$ ./tools/toolchain/dbuild ./configure.py
$ ./tools/toolchain/dbuild ninja build/release/scylla

For further information, please see:

Developer documentation for more information on building Scylla.
Build documentation on how to build Scylla binaries, tests, and packages.
Docker image build documentation for information on how to build Docker images.

Running Scylla

To start Scylla server, run:

$ ./tools/toolchain/dbuild ./build/release/scylla --workdir tmp --smp 1 --developer-mode 1

This will start a Scylla node with one CPU core allocated to it and data files stored in the tmp directory. The --developer-mode is needed to disable the various checks Scylla performs at startup to ensure the machine is configured for maximum performance (not relevant on development workstations). Please note that you need to run Scylla with dbuild if you built it with the frozen toolchain.

For more run options, run:

$ ./tools/toolchain/dbuild ./build/release/scylla --help

Testing

See test.py manual.

Scylla APIs and compatibility

By default, Scylla is compatible with Apache Cassandra and its APIs - CQL and Thrift. There is also support for the API of Amazon DynamoDB™, which needs to be enabled and configured in order to be used. For more information on how to enable the DynamoDB™ API in Scylla, and the current compatibility of this feature as well as Scylla-specific extensions, see Alternator and Getting started with Alternator.

Documentation

Documentation can be found here. Seastar documentation can be found here. User documentation can be found here.

Training

Training material and online courses can be found at Scylla University. The courses are free, self-paced and include hands-on examples. They cover a variety of topics including Scylla data modeling, administration, architecture, basic NoSQL concepts, using drivers for application development, Scylla setup, failover, compactions, multi-datacenters and how Scylla integrates with third-party applications.

Contributing to Scylla

If you want to report a bug or submit a pull request or a patch, please read the contribution guidelines.

If you are a developer working on Scylla, please read the developer guidelines.

Contact

The users mailing list and Slack channel are for users to discuss configuration, management, and operations of the ScyllaDB open source.
The developers mailing list is for developers and people interested in following the development of ScyllaDB to discuss technical topics.

Languages

C++ 72.3%

Python 26.5%

CMake 0.3%

GAP 0.3%

Shell 0.3%