scylladb

mirror of https://github.com/scylladb/scylladb.git synced 2026-05-31 03:56:42 +00:00

Files

Botond Dénes 9dff9752b4 Merge 'Fix regression in Alternator TTL with tablets and node going down' from Nadav Har'El

Recently we suffered a regression on how Alternator TTL behaves when a node goes down when tablets are used.

Usually, expiration of data in a particular tablet are handled by this tablet's "primary replica". However, if that node is down, we want another node to perform these expiration until the primary replica goes back online. We created a function `tablet_map::get_secondary_replica()` to select that "other node". We don't care too much what the "secondary replica" means, but we do care that it's different from the primary replica - if it's the same the expiration of that tablet will never be done.

It turns out that recently, in commits 817fdad and d88036d, the implementation of get_primary_replica() changed without a corresponding change to get_secondary_replica(). After those changes, the two functions are mismatched, and sometimes return the same node for both primary and secondary replica.

Unfortunately, although we had a dtest for the handling of a dead node in Alternator TTL, it failed to reproduce this bug, so this regression was missed - nothing else besides Alternator TTL ever used the get_secondary_replica() function.

So this series, in addition to fixing the bug, we add two tests that reproduce this bug (fail before the fix, pass with the fix):

1. A unit test that checks that get_secondary_replica() always returns a different node from get_primary_replica()
2. A cluster test based on the original dtest, which does reproduce this bug in Alternator TTL where some of the data was never expired (but only failed in release build, for an unknown reason).

Fixes SCYLLADB-777.

Closes scylladb/scylladb#28771

* github.com:scylladb/scylladb:
  test: add unit test for tablet_map::get_secondary_replica()
  test, alternator: add test for TTL expiration with a node down
  locator: fix get_secondary_replica() to match get_primary_replica()

2026-02-25 10:13:55 +02:00

auth_cluster

Merge 'transport: fix connection code to consume only initially taken semaphore units' from Marcin Maliszkiewicz

2026-02-18 13:48:49 +02:00

dtest

test: move dtest/guardrails_test.py to test_guardrails.py

2026-02-20 11:39:52 +01:00

lwt

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_mv_build_during_shutdown started two async CREATE MATERIALIZED VIEW operations and never awaited them (asyncio.gather(...) without await).

2026-02-24 17:25:05 +01:00

object_store

object_storage: add retryable machinery to object storage

2026-02-22 14:00:44 +02:00

random_failures

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

storage

test.py: move storage tests to cluster subdirectory

2026-02-23 16:14:15 +02:00

tasks

test: cluster: task_manager_client: Introduce wait_task_appears()

2026-02-18 01:02:44 +01:00

__init__.py

…

conftest.py

test.py: refactor manager fixture

2026-02-17 14:35:18 +01:00

suite.yaml

test: move dtest/guardrails_test.py to test_guardrails.py

2026-02-20 11:39:52 +01:00

test_aggregation.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_alternator_proxy_protocol.py

test: test_alternator_proxy_protocol: wait for the node to report itself as serving

2026-01-27 17:25:59 +02:00

test_alternator.py

test, alternator: add test for TTL expiration with a node down

2026-02-23 16:19:43 +02:00

test_automatic_cleanup.py

tests: extract get_topology_version helper

2026-02-16 08:57:42 +01:00

test_bad_initial_token.py

…

test_batchlog_manager.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_blocked_bootstrap.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_boot_nodes.py

…

test_bti_index.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_cdc_generation_clearing.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_cdc_generation_data.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_cdc_generation_publishing.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_cdc_with_alter.py

…

test_cdc_with_tablets.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_change_ip.py

test.py: add pid to ServerInfo

2025-12-12 15:11:03 +02:00

test_change_replication_factor_1_to_0.py

…

test_change_rpc_address.py

…

test_client_routes.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_cluster_features.py

test: test_downgrade_after_partial_upgrade: check that feature is disabled on all nodes after partial upgrade

2025-12-30 17:34:56 +01:00

test_commitlog_segment_data_resurrection.py

…

test_commitlog.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_concurrent_schema.py

…

test_config_live_updates.py

auth: remove old permissions cache

2026-02-17 17:56:27 +01:00

test_config.py

…

test_conflicting_keys_read_repair.py

…

test_coordinator_queue_management.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_counter_write_timeout_metric.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_counters_with_tablets.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_crash_coordinator_before_streaming.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_create_table_during_node_shutdown.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_data_resurrection_after_cleanup.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_data_resurrection_in_memtable.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_decommission_kill_then_replace.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_decommission.py

…

test_deprecating_cluster_features.py

…

test_describe.py

…

test_different_group0_ids.py

test/cluster: adjust audit in tests involving decommissioning its ks

2026-02-18 15:14:55 +01:00

test_encryption.py

test_encryption: capture stderr

2026-01-21 14:56:01 +01:00

test_error_becoming_voter.py

…

test_fencing.py

tests: extract get_topology_version helper

2026-02-16 08:57:42 +01:00

test_global_ignore_nodes.py

…

test_gossiper_empty_self_id_on_shadow_round.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_gossiper_orphan_remover.py

test: test_gossiper_orphan_remover: get host ID of the bootstrapping node before it crashes

2026-01-28 10:54:22 +02:00

test_gossiper_race.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_gossiper.py

…

test_group0_recovers_after_partial_command_application.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_guardrails.py

test: move dtest/guardrails_test.py to test_guardrails.py

2026-02-20 11:39:52 +01:00

test_hints.py

test: cluster: Reduce wait time in test_sync_point

2026-02-10 17:05:02 +01:00

test_incremental_repair.py

tests: Re-use manager.get_server_exe()

2026-02-20 14:59:30 +02:00

test_initial_token.py

…

test_internode_compression.py

test/cluster/test_internode_compression: Transpose test from dtest

2026-01-14 10:53:34 +01:00

test_ip_mappings.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_keyspace_rf.py

topology: disable force-gossip-topology-changes option

2026-02-02 09:56:32 +01:00

test_left_node_notification.py

test/cluster: adjust audit in tests involving decommissioning its ks

2026-02-18 15:14:55 +01:00

test_long_join.py

…

test_long_query_timeout_erm.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_lwt_semaphore.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_maintenance_mode.py

test: test_maintenance_mode: enable maintenance mode properly

2026-01-30 12:55:17 +01:00

test_major_compaction.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_metadata_id.py

…

test_multidc.py

db: fail reads and writes with local consistencty level to a DC with RF=0

2026-01-22 12:49:45 +01:00

test_mutation_schema_change.py

…

test_mv.py

tombstone_gc: don't use 'repair' mode for colocated tables

2025-11-25 09:15:46 +01:00

test_no_dc_rack_change.py

…

test_no_removed_node_event_on_ip_change.py

test/cluster: fix two flaky tests

2026-02-16 14:50:54 +02:00

test_node_isolation.py

topology: let banned node know that it is banned

2025-11-24 17:12:13 +01:00

test_node_ops_metrics.py

…

test_node_shutdown_waits_for_pending_requests.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_nodetool.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_not_enough_token_owners.py

test: cluster: Fix NoHostAvailable error in test_not_enough_token_owners

2026-01-08 21:53:47 +02:00

test_proxy_protocol.py

test: test_proxy_protocol: bump timeout

2026-01-23 15:37:00 +02:00

test_query_rebounce.py

…

test_raft_cluster_features.py

topology: disable force-gossip-topology-changes option

2026-02-02 09:56:32 +01:00

test_raft_ignore_nodes.py

…

test_raft_no_quorum.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_raft_recovery_during_join.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_raft_recovery_entry_loss.py

topology: disable force-gossip-topology-changes option

2026-02-02 09:56:32 +01:00

test_raft_recovery_user_data.py

test/cluster: adjust audit in tests involving decommissioning its ks

2026-02-18 15:14:55 +01:00

test_raft_snapshot_request.py

…

test_raft_snapshot_truncation.py

…

test_raft_voters.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_random_tables.py

…

test_read_repair.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_refresh.py

test: Split test_backup.py::check_data_is_back() into two

2026-02-11 12:54:20 +03:00

test_remove_alive_node.py

…

test_remove_rpc_client_with_pending_requests.py

…

test_repair.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_replace_alive_node.py

…

test_replace_with_encryption.py

…

test_replace_with_same_ip_twice.py

…

test_replace.py

…

test_replica_exceptions.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_rest_api_on_startup.py

test: add test_rest_api_on_startup

2025-12-03 15:35:59 +01:00

test_restart_cluster.py

…

test_resurrection.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_reversed_queries_during_simulated_upgrade_process.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_rpc_compression.py

…

test_select_from_mutation_fragments.py

…

test_shutdown_hang.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_size_based_load_balancing.py

test: add read barrier to test_balance_empty_tablets

2026-02-12 11:16:34 +02:00

test_snapshot.py

…

test_sstable_cleanup_stop.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_sstable_compression_config.py

schema: Add initializer for compression defaults

2026-01-13 20:45:59 +02:00

test_sstable_compression_dictionaries_autotrain.py

test: fix configuration of test_autoretrain_dict

2026-02-24 12:08:44 +01:00

test_sstable_compression_dictionaries_basic.py

…

test_sstable_compression_dictionaries_upgrade.py

…

test_sstable_set.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_start_bootstrapped_with_invalid_seed.py

test: disable test_start_bootstrapped_with_invalid_seed

2026-01-15 10:25:45 +01:00

test_streaming_deadlock.py

…

test_strong_consistency.py

test/cluster: add test_strong_consistency.py

2026-01-21 14:56:01 +01:00

test_table_desc_read_barrier.py

test/cluster: fix test_table_desc_read_barrier assertion

2026-02-18 15:14:57 +01:00

test_table_drop.py

topology: disable force-gossip-topology-changes option

2026-02-02 09:56:32 +01:00

test_tablet_repair_scheduler.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_tablet_stats.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_tablets2.py

tests: extract get_topology_version helper

2026-02-16 08:57:42 +01:00

test_tablets_colocation.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_tablets_cql.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_tablets_intranode.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_tablets_lwt.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_tablets_merge.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_tablets_migration.py

test: test_restart_leaving_replica_during_cleanup: reconnect driver after restart

2026-02-16 12:56:18 +01:00

test_tablets_parallel_decommission.py

test_tablets_parallel_decommission: Fix flakiness due to delayed task appearance

2026-02-18 01:02:50 +01:00

test_tablets_removenode.py

test: Use ManagerClient.{disable,enable}_tablet_balancing()

2026-01-13 00:38:00 +01:00

test_tablets.py

topology: disable force-gossip-topology-changes option

2026-02-02 09:56:32 +01:00

test_tls.py

…

test_tombstone_gc.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_tools_perf.py

test: cluster: add continue-after-error to perf tool tests

2026-02-24 11:08:34 +02:00

test_topology_failure_recovery.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_topology_ops_encrypted.py

test: Use ManagerClient.{disable,enable}_tablet_balancing()

2026-01-13 00:38:00 +01:00

test_topology_ops_with_rf_rack_valid.py

test: fix test_remove_node_violating_rf_rack_with_rack_list

2026-02-12 12:58:48 +02:00

test_topology_ops.py

test: Use ManagerClient.{disable,enable}_tablet_balancing()

2026-01-13 00:38:00 +01:00

test_topology_recovery_basic.py

…

test_topology_recovery_majority_loss.py

…

test_topology_rejoin.py

…

test_topology_remove_decom.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_topology_schema.py

…

test_topology_smp.py

…

test_truncate_concurrent_writes.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_truncate_with_drop.py

…

test_truncate_with_tablets.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_unfinished_writes_during_shutdown.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_vector_store.py

index: allow vector indexes without rf_rack_valid_keyspces

2025-12-05 09:26:26 +02:00

test_view_build_status.py

topology: disable force-gossip-topology-changes option

2026-02-02 09:56:32 +01:00

test_view_building_coordinator.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_write_query_during_cql_server_shutdown.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_writes_to_previous_cdc_generations.py

test.py: remove deprecated skip_mode decorator

2026-01-25 18:17:27 +02:00

test_zero_token_nodes_multidc.py

test: test_zero_token_nodes_multidc: properly handle reads with CL=LOCAL_ONE

2026-01-21 15:17:42 +01:00

test_zero_token_nodes_no_replication.py

…

test_zero_token_nodes_topology_ops.py

topology: disable force-gossip-topology-changes option

2026-02-02 09:56:32 +01:00

util.py

tests: extract get_topology_version helper

2026-02-16 08:57:42 +01:00