7 years ago · bc1fd92579
--- a/functional.yaml
+++ b/functional.yaml
@@ -122,12 +122,12 @@ tester-config:
 
				   failure-delay-ms: 7000
			
 
				   failure-shuffle: true
			
 
				   failure-cases:
			
 
				-  - KILL_ONE_FOLLOWER
			
 
				-  - KILL_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT
			
 
				-  - KILL_LEADER
			
 
				-  - KILL_LEADER_UNTIL_TRIGGER_SNAPSHOT
			
 
				-  - KILL_QUORUM
			
 
				-  - KILL_ALL
			
 
				+  - SIGTERM_ONE_FOLLOWER
			
 
				+  - SIGTERM_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT
			
 
				+  - SIGTERM_LEADER
			
 
				+  - SIGTERM_LEADER_UNTIL_TRIGGER_SNAPSHOT
			
 
				+  - SIGTERM_QUORUM
			
 
				+  - SIGTERM_ALL
			
 
				   - BLACKHOLE_PEER_PORT_TX_RX_ONE_FOLLOWER
			
 
				   - BLACKHOLE_PEER_PORT_TX_RX_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT
			
 
				   - BLACKHOLE_PEER_PORT_TX_RX_LEADER
			
--- a/functional/agent/handler.go
+++ b/functional/agent/handler.go
@@ -47,25 +47,29 @@ func (srv *Server) handleTesterRequest(req *rpcpb.Request) (resp *rpcpb.Response
 
				 	}
			
 
				 
			
 
				 	switch req.Operation {
			
 
				-	case rpcpb.Operation_InitialStartEtcd:
			
 
				-		return srv.handleInitialStartEtcd(req)
			
 
				-	case rpcpb.Operation_RestartEtcd:
			
 
				-		return srv.handleRestartEtcd()
			
 
				-	case rpcpb.Operation_KillEtcd:
			
 
				-		return srv.handleKillEtcd()
			
 
				-	case rpcpb.Operation_FailArchive:
			
 
				-		return srv.handleFailArchive()
			
 
				-	case rpcpb.Operation_DestroyEtcdAgent:
			
 
				-		return srv.handleDestroyEtcdAgent()
			
 
				-
			
 
				-	case rpcpb.Operation_BlackholePeerPortTxRx:
			
 
				-		return srv.handleBlackholePeerPortTxRx()
			
 
				-	case rpcpb.Operation_UnblackholePeerPortTxRx:
			
 
				-		return srv.handleUnblackholePeerPortTxRx()
			
 
				-	case rpcpb.Operation_DelayPeerPortTxRx:
			
 
				-		return srv.handleDelayPeerPortTxRx()
			
 
				-	case rpcpb.Operation_UndelayPeerPortTxRx:
			
 
				-		return srv.handleUndelayPeerPortTxRx()
			
 
				+	case rpcpb.Operation_INITIAL_START_ETCD:
			
 
				+		return srv.handle_INITIAL_START_ETCD(req)
			
 
				+	case rpcpb.Operation_RESTART_ETCD:
			
 
				+		return srv.handle_RESTART_ETCD()
			
 
				+
			
 
				+	case rpcpb.Operation_SIGTERM_ETCD:
			
 
				+		return srv.handle_SIGTERM_ETCD()
			
 
				+	case rpcpb.Operation_SIGQUIT_ETCD_AND_REMOVE_DATA:
			
 
				+		return srv.handle_SIGQUIT_ETCD_AND_REMOVE_DATA()
			
 
				+
			
 
				+	case rpcpb.Operation_SIGQUIT_ETCD_AND_ARCHIVE_DATA:
			
 
				+		return srv.handle_SIGQUIT_ETCD_AND_ARCHIVE_DATA()
			
 
				+	case rpcpb.Operation_SIGQUIT_ETCD_AND_REMOVE_DATA_AND_STOP_AGENT:
			
 
				+		return srv.handle_SIGQUIT_ETCD_AND_REMOVE_DATA_AND_STOP_AGENT()
			
 
				+
			
 
				+	case rpcpb.Operation_BLACKHOLE_PEER_PORT_TX_RX:
			
 
				+		return srv.handle_BLACKHOLE_PEER_PORT_TX_RX()
			
 
				+	case rpcpb.Operation_UNBLACKHOLE_PEER_PORT_TX_RX:
			
 
				+		return srv.handle_UNBLACKHOLE_PEER_PORT_TX_RX()
			
 
				+	case rpcpb.Operation_DELAY_PEER_PORT_TX_RX:
			
 
				+		return srv.handle_DELAY_PEER_PORT_TX_RX()
			
 
				+	case rpcpb.Operation_UNDELAY_PEER_PORT_TX_RX:
			
 
				+		return srv.handle_UNDELAY_PEER_PORT_TX_RX()
			
 
				 
			
 
				 	default:
			
 
				 		msg := fmt.Sprintf("operation not found (%v)", req.Operation)
			
@@ -73,11 +77,11 @@ func (srv *Server) handleTesterRequest(req *rpcpb.Request) (resp *rpcpb.Response
 
				 	}
			
 
				 }
			
 
				 
			
 
				-func (srv *Server) handleInitialStartEtcd(req *rpcpb.Request) (*rpcpb.Response, error) {
			
 
				-	if srv.last != rpcpb.Operation_NotStarted {
			
 
				+func (srv *Server) handle_INITIAL_START_ETCD(req *rpcpb.Request) (*rpcpb.Response, error) {
			
 
				+	if srv.last != rpcpb.Operation_NOT_STARTED {
			
 
				 		return &rpcpb.Response{
			
 
				 			Success: false,
			
 
				-			Status:  fmt.Sprintf("%q is not valid; last server operation was %q", rpcpb.Operation_InitialStartEtcd.String(), srv.last.String()),
			
 
				+			Status:  fmt.Sprintf("%q is not valid; last server operation was %q", rpcpb.Operation_INITIAL_START_ETCD.String(), srv.last.String()),
			
 
				 			Member:  req.Member,
			
 
				 		}, nil
			
 
				 	}
			
@@ -403,10 +407,17 @@ func (srv *Server) startEtcdCmd() error {
 
				 	return srv.etcdCmd.Start()
			
 
				 }
			
 
				 
			
 
				-func (srv *Server) handleRestartEtcd() (*rpcpb.Response, error) {
			
 
				+func (srv *Server) handle_RESTART_ETCD() (*rpcpb.Response, error) {
			
 
				+	var err error
			
 
				+	if !fileutil.Exist(srv.Member.BaseDir) {
			
 
				+		err = fileutil.TouchDirAll(srv.Member.BaseDir)
			
 
				+		if err != nil {
			
 
				+			return nil, err
			
 
				+		}
			
 
				+	}
			
 
				+
			
 
				 	srv.creatEtcdCmd()
			
 
				 
			
 
				-	var err error
			
 
				 	if err = srv.saveTLSAssets(); err != nil {
			
 
				 		return nil, err
			
 
				 	}
			
@@ -434,7 +445,7 @@ func (srv *Server) handleRestartEtcd() (*rpcpb.Response, error) {
 
				 	}, nil
			
 
				 }
			
 
				 
			
 
				-func (srv *Server) handleKillEtcd() (*rpcpb.Response, error) {
			
 
				+func (srv *Server) handle_SIGTERM_ETCD() (*rpcpb.Response, error) {
			
 
				 	srv.stopProxy()
			
 
				 
			
 
				 	err := stopWithSig(srv.etcdCmd, syscall.SIGTERM)
			
@@ -449,7 +460,28 @@ func (srv *Server) handleKillEtcd() (*rpcpb.Response, error) {
 
				 	}, nil
			
 
				 }
			
 
				 
			
 
				-func (srv *Server) handleFailArchive() (*rpcpb.Response, error) {
			
 
				+func (srv *Server) handle_SIGQUIT_ETCD_AND_REMOVE_DATA() (*rpcpb.Response, error) {
			
 
				+	srv.stopProxy()
			
 
				+
			
 
				+	err := stopWithSig(srv.etcdCmd, syscall.SIGQUIT)
			
 
				+	if err != nil {
			
 
				+		return nil, err
			
 
				+	}
			
 
				+	srv.lg.Info("killed etcd", zap.String("signal", syscall.SIGQUIT.String()))
			
 
				+
			
 
				+	err = os.RemoveAll(srv.Member.BaseDir)
			
 
				+	if err != nil {
			
 
				+		return nil, err
			
 
				+	}
			
 
				+	srv.lg.Info("removed base directory", zap.String("dir", srv.Member.BaseDir))
			
 
				+
			
 
				+	return &rpcpb.Response{
			
 
				+		Success: true,
			
 
				+		Status:  "killed etcd and removed base directory",
			
 
				+	}, nil
			
 
				+}
			
 
				+
			
 
				+func (srv *Server) handle_SIGQUIT_ETCD_AND_ARCHIVE_DATA() (*rpcpb.Response, error) {
			
 
				 	srv.stopProxy()
			
 
				 
			
 
				 	// exit with stackstrace
			
@@ -489,12 +521,14 @@ func (srv *Server) handleFailArchive() (*rpcpb.Response, error) {
 
				 }
			
 
				 
			
 
				 // stop proxy, etcd, delete data directory
			
 
				-func (srv *Server) handleDestroyEtcdAgent() (*rpcpb.Response, error) {
			
 
				-	err := stopWithSig(srv.etcdCmd, syscall.SIGTERM)
			
 
				+func (srv *Server) handle_SIGQUIT_ETCD_AND_REMOVE_DATA_AND_STOP_AGENT() (*rpcpb.Response, error) {
			
 
				+	srv.stopProxy()
			
 
				+
			
 
				+	err := stopWithSig(srv.etcdCmd, syscall.SIGQUIT)
			
 
				 	if err != nil {
			
 
				 		return nil, err
			
 
				 	}
			
 
				-	srv.lg.Info("killed etcd", zap.String("signal", syscall.SIGTERM.String()))
			
 
				+	srv.lg.Info("killed etcd", zap.String("signal", syscall.SIGQUIT.String()))
			
 
				 
			
 
				 	err = os.RemoveAll(srv.Member.BaseDir)
			
 
				 	if err != nil {
			
@@ -505,22 +539,13 @@ func (srv *Server) handleDestroyEtcdAgent() (*rpcpb.Response, error) {
 
				 	// stop agent server
			
 
				 	srv.Stop()
			
 
				 
			
 
				-	for port, px := range srv.advertiseClientPortToProxy {
			
 
				-		err := px.Close()
			
 
				-		srv.lg.Info("closed proxy", zap.Int("client-port", port), zap.Error(err))
			
 
				-	}
			
 
				-	for port, px := range srv.advertisePeerPortToProxy {
			
 
				-		err := px.Close()
			
 
				-		srv.lg.Info("closed proxy", zap.Int("peer-port", port), zap.Error(err))
			
 
				-	}
			
 
				-
			
 
				 	return &rpcpb.Response{
			
 
				 		Success: true,
			
 
				 		Status:  "destroyed etcd and agent",
			
 
				 	}, nil
			
 
				 }
			
 
				 
			
 
				-func (srv *Server) handleBlackholePeerPortTxRx() (*rpcpb.Response, error) {
			
 
				+func (srv *Server) handle_BLACKHOLE_PEER_PORT_TX_RX() (*rpcpb.Response, error) {
			
 
				 	for port, px := range srv.advertisePeerPortToProxy {
			
 
				 		srv.lg.Info("blackholing", zap.Int("peer-port", port))
			
 
				 		px.BlackholeTx()
			
@@ -533,7 +558,7 @@ func (srv *Server) handleBlackholePeerPortTxRx() (*rpcpb.Response, error) {
 
				 	}, nil
			
 
				 }
			
 
				 
			
 
				-func (srv *Server) handleUnblackholePeerPortTxRx() (*rpcpb.Response, error) {
			
 
				+func (srv *Server) handle_UNBLACKHOLE_PEER_PORT_TX_RX() (*rpcpb.Response, error) {
			
 
				 	for port, px := range srv.advertisePeerPortToProxy {
			
 
				 		srv.lg.Info("unblackholing", zap.Int("peer-port", port))
			
 
				 		px.UnblackholeTx()
			
@@ -546,7 +571,7 @@ func (srv *Server) handleUnblackholePeerPortTxRx() (*rpcpb.Response, error) {
 
				 	}, nil
			
 
				 }
			
 
				 
			
 
				-func (srv *Server) handleDelayPeerPortTxRx() (*rpcpb.Response, error) {
			
 
				+func (srv *Server) handle_DELAY_PEER_PORT_TX_RX() (*rpcpb.Response, error) {
			
 
				 	lat := time.Duration(srv.Tester.UpdatedDelayLatencyMs) * time.Millisecond
			
 
				 	rv := time.Duration(srv.Tester.DelayLatencyMsRv) * time.Millisecond
			
 
				 
			
@@ -571,7 +596,7 @@ func (srv *Server) handleDelayPeerPortTxRx() (*rpcpb.Response, error) {
 
				 	}, nil
			
 
				 }
			
 
				 
			
 
				-func (srv *Server) handleUndelayPeerPortTxRx() (*rpcpb.Response, error) {
			
 
				+func (srv *Server) handle_UNDELAY_PEER_PORT_TX_RX() (*rpcpb.Response, error) {
			
 
				 	for port, px := range srv.advertisePeerPortToProxy {
			
 
				 		srv.lg.Info("undelaying", zap.Int("peer-port", port))
			
 
				 		px.UndelayTx()
			
--- a/functional/agent/server.go
+++ b/functional/agent/server.go
@@ -64,7 +64,7 @@ func NewServer(
 
				 		lg:      lg,
			
 
				 		network: network,
			
 
				 		address: address,
			
 
				-		last:    rpcpb.Operation_NotStarted,
			
 
				+		last:    rpcpb.Operation_NOT_STARTED,
			
 
				 		advertiseClientPortToProxy: make(map[int]proxy.Server),
			
 
				 		advertisePeerPortToProxy:   make(map[int]proxy.Server),
			
 
				 	}
			
--- a/functional/cmd/etcd-tester/main.go
+++ b/functional/cmd/etcd-tester/main.go
@@ -44,11 +44,11 @@ func main() {
 
				 		logger.Fatal("failed to create a cluster", zap.Error(err))
			
 
				 	}
			
 
				 
			
 
				-	err = clus.Bootstrap()
			
 
				+	err = clus.Send_INITIAL_START_ETCD()
			
 
				 	if err != nil {
			
 
				 		logger.Fatal("Bootstrap failed", zap.Error(err))
			
 
				 	}
			
 
				-	defer clus.DestroyEtcdAgents()
			
 
				+	defer clus.Send_SIGQUIT_ETCD_AND_REMOVE_DATA_AND_STOP_AGENT()
			
 
				 
			
 
				 	logger.Info("wait health after bootstrap")
			
 
				 	err = clus.WaitHealth()
			
--- a/functional/rpcpb/rpc.pb.go
+++ b/functional/rpcpb/rpc.pb.go
--- a/functional/rpcpb/rpc.proto
+++ b/functional/rpcpb/rpc.proto
@@ -8,75 +8,23 @@ option (gogoproto.sizer_all) = true;
 
				 option (gogoproto.unmarshaler_all) = true;
			
 
				 option (gogoproto.goproto_getters_all) = false;
			
 
				 
			
 
				-service Transport {
			
 
				-  rpc Transport(stream Request) returns (stream Response) {}
			
 
				+message Request {
			
 
				+  Operation Operation = 1;
			
 
				+  // Member contains the same Member object from tester configuration.
			
 
				+  Member Member = 2;
			
 
				+  // Tester contains tester configuration.
			
 
				+  Tester Tester = 3;
			
 
				 }
			
 
				 
			
 
				-enum Operation {
			
 
				-  NotStarted = 0;
			
 
				-
			
 
				-  // InitialStartEtcd is only called to start etcd very first time.
			
 
				-  InitialStartEtcd = 1;
			
 
				-  // RestartEtcd is sent to restart killed etcd.
			
 
				-  RestartEtcd = 2;
			
 
				-  // KillEtcd pauses etcd process while keeping data directories
			
 
				-  // and previous etcd configurations.
			
 
				-  KillEtcd = 3;
			
 
				-  // FailArchive is sent when consistency check failed,
			
 
				-  // thus need to archive etcd data directories.
			
 
				-  FailArchive = 4;
			
 
				-  // DestroyEtcdAgent destroys etcd process, etcd data, and agent server.
			
 
				-  DestroyEtcdAgent = 5;
			
 
				-
			
 
				-  // BlackholePeerPortTxRx drops all outgoing/incoming packets from/to the
			
 
				-  // peer port on target member's peer port.
			
 
				-  BlackholePeerPortTxRx = 100;
			
 
				-  // UnblackholePeerPortTxRx removes outgoing/incoming packet dropping.
			
 
				-  UnblackholePeerPortTxRx = 101;
			
 
				-  // DelayPeerPortTxRx delays all outgoing/incoming packets from/to the
			
 
				-  // peer port on target member's peer port.
			
 
				-  DelayPeerPortTxRx = 102;
			
 
				-  // UndelayPeerPortTxRx removes all outgoing/incoming delays.
			
 
				-  UndelayPeerPortTxRx = 103;
			
 
				+message Response {
			
 
				+  bool Success = 1;
			
 
				+  string Status = 2;
			
 
				+  // Member contains the same Member object from tester request.
			
 
				+  Member Member = 3;
			
 
				 }
			
 
				 
			
 
				-message Etcd {
			
 
				-  string Name = 1 [(gogoproto.moretags) = "yaml:\"name\""];
			
 
				-  string DataDir = 2 [(gogoproto.moretags) = "yaml:\"data-dir\""];
			
 
				-  string WALDir = 3 [(gogoproto.moretags) = "yaml:\"wal-dir\""];
			
 
				-
			
 
				-  // HeartbeatIntervalMs is the time (in milliseconds) of a heartbeat interval.
			
 
				-  // Default value is 100, which is 100ms.
			
 
				-  int64 HeartbeatIntervalMs = 11 [(gogoproto.moretags) = "yaml:\"heartbeat-interval\""];
			
 
				-  // ElectionTimeoutMs is the time (in milliseconds) for an election to timeout.
			
 
				-  // Default value is 1000, which is 1s.
			
 
				-  int64 ElectionTimeoutMs = 12 [(gogoproto.moretags) = "yaml:\"election-timeout\""];
			
 
				-
			
 
				-  repeated string ListenClientURLs = 21 [(gogoproto.moretags) = "yaml:\"listen-client-urls\""];
			
 
				-  repeated string AdvertiseClientURLs = 22 [(gogoproto.moretags) = "yaml:\"advertise-client-urls\""];
			
 
				-  bool ClientAutoTLS = 23 [(gogoproto.moretags) = "yaml:\"auto-tls\""];
			
 
				-  bool ClientCertAuth = 24 [(gogoproto.moretags) = "yaml:\"client-cert-auth\""];
			
 
				-  string ClientCertFile = 25 [(gogoproto.moretags) = "yaml:\"cert-file\""];
			
 
				-  string ClientKeyFile = 26 [(gogoproto.moretags) = "yaml:\"key-file\""];
			
 
				-  string ClientTrustedCAFile = 27 [(gogoproto.moretags) = "yaml:\"trusted-ca-file\""];
			
 
				-
			
 
				-  repeated string ListenPeerURLs = 31 [(gogoproto.moretags) = "yaml:\"listen-peer-urls\""];
			
 
				-  repeated string AdvertisePeerURLs = 32 [(gogoproto.moretags) = "yaml:\"initial-advertise-peer-urls\""];
			
 
				-  bool PeerAutoTLS = 33 [(gogoproto.moretags) = "yaml:\"peer-auto-tls\""];
			
 
				-  bool PeerClientCertAuth = 34 [(gogoproto.moretags) = "yaml:\"peer-client-cert-auth\""];
			
 
				-  string PeerCertFile = 35 [(gogoproto.moretags) = "yaml:\"peer-cert-file\""];
			
 
				-  string PeerKeyFile = 36 [(gogoproto.moretags) = "yaml:\"peer-key-file\""];
			
 
				-  string PeerTrustedCAFile = 37 [(gogoproto.moretags) = "yaml:\"peer-trusted-ca-file\""];
			
 
				-
			
 
				-  string InitialCluster = 41 [(gogoproto.moretags) = "yaml:\"initial-cluster\""];
			
 
				-  string InitialClusterState = 42 [(gogoproto.moretags) = "yaml:\"initial-cluster-state\""];
			
 
				-  string InitialClusterToken = 43 [(gogoproto.moretags) = "yaml:\"initial-cluster-token\""];
			
 
				-
			
 
				-  int64 SnapshotCount = 51 [(gogoproto.moretags) = "yaml:\"snapshot-count\""];
			
 
				-  int64 QuotaBackendBytes = 52 [(gogoproto.moretags) = "yaml:\"quota-backend-bytes\""];
			
 
				-
			
 
				-  bool PreVote = 63 [(gogoproto.moretags) = "yaml:\"pre-vote\""];
			
 
				-  bool InitialCorruptCheck = 64 [(gogoproto.moretags) = "yaml:\"initial-corrupt-check\""];
			
 
				+service Transport {
			
 
				+  rpc Transport(stream Request) returns (stream Response) {}
			
 
				 }
			
 
				 
			
 
				 message Member {
			
@@ -128,18 +76,156 @@ message Member {
 
				   string PeerTrustedCAPath = 506 [(gogoproto.moretags) = "yaml:\"peer-trusted-ca-path\""];
			
 
				 }
			
 
				 
			
 
				+message Tester {
			
 
				+  string DataDir = 1 [(gogoproto.moretags) = "yaml:\"data-dir\""];
			
 
				+  string Network = 2 [(gogoproto.moretags) = "yaml:\"network\""];
			
 
				+  string Addr = 3 [(gogoproto.moretags) = "yaml:\"addr\""];
			
 
				+
			
 
				+  // DelayLatencyMsRv is the delay latency in milliseconds,
			
 
				+  // to inject to simulated slow network.
			
 
				+  uint32 DelayLatencyMs = 11 [(gogoproto.moretags) = "yaml:\"delay-latency-ms\""];
			
 
				+  // DelayLatencyMsRv is the delay latency random variable in milliseconds.
			
 
				+  uint32 DelayLatencyMsRv = 12 [(gogoproto.moretags) = "yaml:\"delay-latency-ms-rv\""];
			
 
				+  // UpdatedDelayLatencyMs is the update delay latency in milliseconds,
			
 
				+  // to inject to simulated slow network. It's the final latency to apply,
			
 
				+  // in case the latency numbers are randomly generated from given delay latency field.
			
 
				+  uint32 UpdatedDelayLatencyMs = 13 [(gogoproto.moretags) = "yaml:\"updated-delay-latency-ms\""];
			
 
				+
			
 
				+  // RoundLimit is the limit of rounds to run failure set (-1 to run without limits).
			
 
				+  int32 RoundLimit = 21 [(gogoproto.moretags) = "yaml:\"round-limit\""];
			
 
				+  // ExitOnFailure is true, then exit tester on first failure.
			
 
				+  bool ExitOnFailure = 22 [(gogoproto.moretags) = "yaml:\"exit-on-failure\""];
			
 
				+  // ConsistencyCheck is true to check consistency (revision, hash).
			
 
				+  bool ConsistencyCheck = 23 [(gogoproto.moretags) = "yaml:\"consistency-check\""];
			
 
				+  // EnablePprof is true to enable profiler.
			
 
				+  bool EnablePprof = 24 [(gogoproto.moretags) = "yaml:\"enable-pprof\""];
			
 
				+
			
 
				+  // FailureDelayMs is the delay duration after failure is injected.
			
 
				+  // Useful when triggering snapshot or no-op failure cases.
			
 
				+  uint32 FailureDelayMs = 31 [(gogoproto.moretags) = "yaml:\"failure-delay-ms\""];
			
 
				+  // FailureShuffle is true to randomize failure injecting order.
			
 
				+  bool FailureShuffle = 32 [(gogoproto.moretags) = "yaml:\"failure-shuffle\""];
			
 
				+  // FailureCases is the selected test cases to schedule.
			
 
				+  // If empty, run all failure cases.
			
 
				+  repeated string FailureCases = 33 [(gogoproto.moretags) = "yaml:\"failure-cases\""];
			
 
				+  // Failpoinommands is the list of "gofail" commands (e.g. panic("etcd-tester"),1*sleep(1000)
			
 
				+  repeated string FailpointCommands = 34 [(gogoproto.moretags) = "yaml:\"failpoint-commands\""];
			
 
				+
			
 
				+  // RunnerExecPath is a path of etcd-runner binary.
			
 
				+  string RunnerExecPath = 41 [(gogoproto.moretags) = "yaml:\"runner-exec-path\""];
			
 
				+  // ExternalExecPath is a path of script for enabling/disabling an external fault injector.
			
 
				+  string ExternalExecPath = 42 [(gogoproto.moretags) = "yaml:\"external-exec-path\""];
			
 
				+
			
 
				+  // StressTypes is the list of stresser names:
			
 
				+  // keys, lease, nop, election-runner, watch-runner, lock-racer-runner, lease-runner.
			
 
				+  repeated string StressTypes = 101 [(gogoproto.moretags) = "yaml:\"stress-types\""];
			
 
				+  // StressKeySize is the size of each small key written into etcd.
			
 
				+  int32 StressKeySize = 102 [(gogoproto.moretags) = "yaml:\"stress-key-size\""];
			
 
				+  // StressKeySizeLarge is the size of each large key written into etcd.
			
 
				+  int32 StressKeySizeLarge = 103 [(gogoproto.moretags) = "yaml:\"stress-key-size-large\""];
			
 
				+  // StressKeySuffixRange is the count of key range written into etcd.
			
 
				+  // Stress keys are created with "fmt.Sprintf("foo%016x", rand.Intn(keySuffixRange)".
			
 
				+  int32 StressKeySuffixRange = 104 [(gogoproto.moretags) = "yaml:\"stress-key-suffix-range\""];
			
 
				+  // StressKeySuffixRangeTxn is the count of key range written into etcd txn (max 100).
			
 
				+  // Stress keys are created with "fmt.Sprintf("/k%03d", i)".
			
 
				+  int32 StressKeySuffixRangeTxn = 105 [(gogoproto.moretags) = "yaml:\"stress-key-suffix-range-txn\""];
			
 
				+  // StressKeyTxnOps is the number of operations per a transaction (max 64).
			
 
				+  int32 StressKeyTxnOps = 106 [(gogoproto.moretags) = "yaml:\"stress-key-txn-ops\""];
			
 
				+
			
 
				+  // StressClients is the number of concurrent stressing clients
			
 
				+  // with "one" shared TCP connection.
			
 
				+  int32 StressClients = 201 [(gogoproto.moretags) = "yaml:\"stress-clients\""];
			
 
				+  // StressQPS is the maximum number of stresser requests per second.
			
 
				+  int32 StressQPS = 202 [(gogoproto.moretags) = "yaml:\"stress-qps\""];
			
 
				+}
			
 
				+
			
 
				+message Etcd {
			
 
				+  string Name = 1 [(gogoproto.moretags) = "yaml:\"name\""];
			
 
				+  string DataDir = 2 [(gogoproto.moretags) = "yaml:\"data-dir\""];
			
 
				+  string WALDir = 3 [(gogoproto.moretags) = "yaml:\"wal-dir\""];
			
 
				+
			
 
				+  // HeartbeatIntervalMs is the time (in milliseconds) of a heartbeat interval.
			
 
				+  // Default value is 100, which is 100ms.
			
 
				+  int64 HeartbeatIntervalMs = 11 [(gogoproto.moretags) = "yaml:\"heartbeat-interval\""];
			
 
				+  // ElectionTimeoutMs is the time (in milliseconds) for an election to timeout.
			
 
				+  // Default value is 1000, which is 1s.
			
 
				+  int64 ElectionTimeoutMs = 12 [(gogoproto.moretags) = "yaml:\"election-timeout\""];
			
 
				+
			
 
				+  repeated string ListenClientURLs = 21 [(gogoproto.moretags) = "yaml:\"listen-client-urls\""];
			
 
				+  repeated string AdvertiseClientURLs = 22 [(gogoproto.moretags) = "yaml:\"advertise-client-urls\""];
			
 
				+  bool ClientAutoTLS = 23 [(gogoproto.moretags) = "yaml:\"auto-tls\""];
			
 
				+  bool ClientCertAuth = 24 [(gogoproto.moretags) = "yaml:\"client-cert-auth\""];
			
 
				+  string ClientCertFile = 25 [(gogoproto.moretags) = "yaml:\"cert-file\""];
			
 
				+  string ClientKeyFile = 26 [(gogoproto.moretags) = "yaml:\"key-file\""];
			
 
				+  string ClientTrustedCAFile = 27 [(gogoproto.moretags) = "yaml:\"trusted-ca-file\""];
			
 
				+
			
 
				+  repeated string ListenPeerURLs = 31 [(gogoproto.moretags) = "yaml:\"listen-peer-urls\""];
			
 
				+  repeated string AdvertisePeerURLs = 32 [(gogoproto.moretags) = "yaml:\"initial-advertise-peer-urls\""];
			
 
				+  bool PeerAutoTLS = 33 [(gogoproto.moretags) = "yaml:\"peer-auto-tls\""];
			
 
				+  bool PeerClientCertAuth = 34 [(gogoproto.moretags) = "yaml:\"peer-client-cert-auth\""];
			
 
				+  string PeerCertFile = 35 [(gogoproto.moretags) = "yaml:\"peer-cert-file\""];
			
 
				+  string PeerKeyFile = 36 [(gogoproto.moretags) = "yaml:\"peer-key-file\""];
			
 
				+  string PeerTrustedCAFile = 37 [(gogoproto.moretags) = "yaml:\"peer-trusted-ca-file\""];
			
 
				+
			
 
				+  string InitialCluster = 41 [(gogoproto.moretags) = "yaml:\"initial-cluster\""];
			
 
				+  string InitialClusterState = 42 [(gogoproto.moretags) = "yaml:\"initial-cluster-state\""];
			
 
				+  string InitialClusterToken = 43 [(gogoproto.moretags) = "yaml:\"initial-cluster-token\""];
			
 
				+
			
 
				+  int64 SnapshotCount = 51 [(gogoproto.moretags) = "yaml:\"snapshot-count\""];
			
 
				+  int64 QuotaBackendBytes = 52 [(gogoproto.moretags) = "yaml:\"quota-backend-bytes\""];
			
 
				+
			
 
				+  bool PreVote = 63 [(gogoproto.moretags) = "yaml:\"pre-vote\""];
			
 
				+  bool InitialCorruptCheck = 64 [(gogoproto.moretags) = "yaml:\"initial-corrupt-check\""];
			
 
				+}
			
 
				+
			
 
				+enum Operation {
			
 
				+  // NOT_STARTED is the agent status before etcd first start.
			
 
				+  NOT_STARTED = 0;
			
 
				+
			
 
				+  // INITIAL_START_ETCD is only called to start etcd, the very first time.
			
 
				+  INITIAL_START_ETCD = 10;
			
 
				+  // RESTART_ETCD is sent to restart killed etcd.
			
 
				+  RESTART_ETCD = 11;
			
 
				+
			
 
				+  // SIGTERM_ETCD pauses etcd process while keeping data directories
			
 
				+  // and previous etcd configurations.
			
 
				+  SIGTERM_ETCD = 20;
			
 
				+  // SIGQUIT_ETCD_AND_REMOVE_DATA kills etcd process and removes all data
			
 
				+  // directories to simulate destroying the whole machine.
			
 
				+  SIGQUIT_ETCD_AND_REMOVE_DATA = 21;
			
 
				+
			
 
				+  // SIGQUIT_ETCD_AND_ARCHIVE_DATA is sent when consistency check failed,
			
 
				+  // thus need to archive etcd data directories.
			
 
				+  SIGQUIT_ETCD_AND_ARCHIVE_DATA = 30;
			
 
				+  // SIGQUIT_ETCD_AND_REMOVE_DATA_AND_STOP_AGENT destroys etcd process,
			
 
				+  // etcd data, and agent server.
			
 
				+  SIGQUIT_ETCD_AND_REMOVE_DATA_AND_STOP_AGENT = 31;
			
 
				+
			
 
				+  // BLACKHOLE_PEER_PORT_TX_RX drops all outgoing/incoming packets from/to
			
 
				+  // the peer port on target member's peer port.
			
 
				+  BLACKHOLE_PEER_PORT_TX_RX = 100;
			
 
				+  // UNBLACKHOLE_PEER_PORT_TX_RX removes outgoing/incoming packet dropping.
			
 
				+  UNBLACKHOLE_PEER_PORT_TX_RX = 101;
			
 
				+
			
 
				+  // DELAY_PEER_PORT_TX_RX delays all outgoing/incoming packets from/to
			
 
				+  // the peer port on target member's peer port.
			
 
				+  DELAY_PEER_PORT_TX_RX = 200;
			
 
				+  // UNDELAY_PEER_PORT_TX_RX removes all outgoing/incoming delays.
			
 
				+  UNDELAY_PEER_PORT_TX_RX = 201;
			
 
				+}
			
 
				+
			
 
				 // FailureCase defines various system faults in distributed systems,
			
 
				 // in order to verify correct behavior of etcd servers and clients.
			
 
				 enum FailureCase {
			
 
				-  // KILL_ONE_FOLLOWER stops a randomly chosen follower (non-leader)
			
 
				+  // SIGTERM_ONE_FOLLOWER stops a randomly chosen follower (non-leader)
			
 
				   // but does not delete its data directories on disk for next restart.
			
 
				   // It waits "failure-delay-ms" before recovering this failure.
			
 
				   // The expected behavior is that the follower comes back online
			
 
				   // and rejoins the cluster, and then each member continues to process
			
 
				   // client requests ('Put' request that requires Raft consensus).
			
 
				-  KILL_ONE_FOLLOWER = 0;
			
 
				+  SIGTERM_ONE_FOLLOWER = 0;
			
 
				 
			
 
				-  // KILL_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT stops a randomly chosen
			
 
				+  // SIGTERM_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT stops a randomly chosen
			
 
				   // follower but does not delete its data directories on disk for next
			
 
				   // restart. And waits until most up-to-date node (leader) applies the
			
 
				   // snapshot count of entries since the stop operation.
			
@@ -148,9 +234,9 @@ enum FailureCase {
 
				   // to the follower to force it to follow the leader's log.
			
 
				   // As always, after recovery, each member must be able to process
			
 
				   // client requests.
			
 
				-  KILL_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT = 1;
			
 
				+  SIGTERM_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT = 1;
			
 
				 
			
 
				-  // KILL_LEADER stops the active leader node but does not delete its
			
 
				+  // SIGTERM_LEADER stops the active leader node but does not delete its
			
 
				   // data directories on disk for next restart. Then it waits
			
 
				   // "failure-delay-ms" before recovering this failure, in order to
			
 
				   // trigger election timeouts.
			
@@ -158,9 +244,9 @@ enum FailureCase {
 
				   // old leader comes back online and rejoins the cluster as a follower.
			
 
				   // As always, after recovery, each member must be able to process
			
 
				   // client requests.
			
 
				-  KILL_LEADER = 2;
			
 
				+  SIGTERM_LEADER = 2;
			
 
				 
			
 
				-  // KILL_LEADER_UNTIL_TRIGGER_SNAPSHOT stops the active leader node
			
 
				+  // SIGTERM_LEADER_UNTIL_TRIGGER_SNAPSHOT stops the active leader node
			
 
				   // but does not delete its data directories on disk for next restart.
			
 
				   // And waits until most up-to-date node ("new" leader) applies the
			
 
				   // snapshot count of entries since the stop operation.
			
@@ -169,24 +255,24 @@ enum FailureCase {
 
				   // And it receives the snapshot from the new leader to overwrite its
			
 
				   // store. As always, after recovery, each member must be able to
			
 
				   // process client requests.
			
 
				-  KILL_LEADER_UNTIL_TRIGGER_SNAPSHOT = 3;
			
 
				+  SIGTERM_LEADER_UNTIL_TRIGGER_SNAPSHOT = 3;
			
 
				 
			
 
				-  // KILL_QUORUM stops majority number of nodes to make the whole cluster
			
 
				+  // SIGTERM_QUORUM stops majority number of nodes to make the whole cluster
			
 
				   // inoperable but does not delete data directories on stopped nodes
			
 
				   // for next restart. And it waits "failure-delay-ms" before recovering
			
 
				   // this failure.
			
 
				   // The expected behavior is that nodes come back online, thus cluster
			
 
				   // comes back operative as well. As always, after recovery, each member
			
 
				   // must be able to process client requests.
			
 
				-  KILL_QUORUM = 4;
			
 
				+  SIGTERM_QUORUM = 4;
			
 
				 
			
 
				-  // KILL_ALL stops the whole cluster but does not delete data directories
			
 
				+  // SIGTERM_ALL stops the whole cluster but does not delete data directories
			
 
				   // on disk for next restart. And it waits "failure-delay-ms" before
			
 
				   // recovering this failure.
			
 
				   // The expected behavior is that nodes come back online, thus cluster
			
 
				   // comes back operative as well. As always, after recovery, each member
			
 
				   // must be able to process client requests.
			
 
				-  KILL_ALL = 5;
			
 
				+  SIGTERM_ALL = 5;
			
 
				 
			
 
				   // BLACKHOLE_PEER_PORT_TX_RX_ONE_FOLLOWER drops all outgoing/incoming
			
 
				   // packets from/to the peer port on a randomly chosen follower
			
@@ -392,81 +478,3 @@ enum StressType {
 
				   LOCK_RACER_RUNNER = 4;
			
 
				   LEASE_RUNNER = 5;
			
 
				 }
			
 
				-
			
 
				-message Tester {
			
 
				-  string DataDir = 1 [(gogoproto.moretags) = "yaml:\"data-dir\""];
			
 
				-  string Network = 2 [(gogoproto.moretags) = "yaml:\"network\""];
			
 
				-  string Addr = 3 [(gogoproto.moretags) = "yaml:\"addr\""];
			
 
				-
			
 
				-  // DelayLatencyMsRv is the delay latency in milliseconds,
			
 
				-  // to inject to simulated slow network.
			
 
				-  uint32 DelayLatencyMs = 11 [(gogoproto.moretags) = "yaml:\"delay-latency-ms\""];
			
 
				-  // DelayLatencyMsRv is the delay latency random variable in milliseconds.
			
 
				-  uint32 DelayLatencyMsRv = 12 [(gogoproto.moretags) = "yaml:\"delay-latency-ms-rv\""];
			
 
				-  // UpdatedDelayLatencyMs is the update delay latency in milliseconds,
			
 
				-  // to inject to simulated slow network. It's the final latency to apply,
			
 
				-  // in case the latency numbers are randomly generated from given delay latency field.
			
 
				-  uint32 UpdatedDelayLatencyMs = 13 [(gogoproto.moretags) = "yaml:\"updated-delay-latency-ms\""];
			
 
				-
			
 
				-  // RoundLimit is the limit of rounds to run failure set (-1 to run without limits).
			
 
				-  int32 RoundLimit = 21 [(gogoproto.moretags) = "yaml:\"round-limit\""];
			
 
				-  // ExitOnFailure is true, then exit tester on first failure.
			
 
				-  bool ExitOnFailure = 22 [(gogoproto.moretags) = "yaml:\"exit-on-failure\""];
			
 
				-  // ConsistencyCheck is true to check consistency (revision, hash).
			
 
				-  bool ConsistencyCheck = 23 [(gogoproto.moretags) = "yaml:\"consistency-check\""];
			
 
				-  // EnablePprof is true to enable profiler.
			
 
				-  bool EnablePprof = 24 [(gogoproto.moretags) = "yaml:\"enable-pprof\""];
			
 
				-
			
 
				-  // FailureDelayMs is the delay duration after failure is injected.
			
 
				-  // Useful when triggering snapshot or no-op failure cases.
			
 
				-  uint32 FailureDelayMs = 31 [(gogoproto.moretags) = "yaml:\"failure-delay-ms\""];
			
 
				-  // FailureShuffle is true to randomize failure injecting order.
			
 
				-  bool FailureShuffle = 32 [(gogoproto.moretags) = "yaml:\"failure-shuffle\""];
			
 
				-  // FailureCases is the selected test cases to schedule.
			
 
				-  // If empty, run all failure cases.
			
 
				-  repeated string FailureCases = 33 [(gogoproto.moretags) = "yaml:\"failure-cases\""];
			
 
				-  // Failpoinommands is the list of "gofail" commands (e.g. panic("etcd-tester"),1*sleep(1000)
			
 
				-  repeated string FailpointCommands = 34 [(gogoproto.moretags) = "yaml:\"failpoint-commands\""];
			
 
				-
			
 
				-  // RunnerExecPath is a path of etcd-runner binary.
			
 
				-  string RunnerExecPath = 41 [(gogoproto.moretags) = "yaml:\"runner-exec-path\""];
			
 
				-  // ExternalExecPath is a path of script for enabling/disabling an external fault injector.
			
 
				-  string ExternalExecPath = 42 [(gogoproto.moretags) = "yaml:\"external-exec-path\""];
			
 
				-
			
 
				-  // StressTypes is the list of stresser names:
			
 
				-  // keys, lease, nop, election-runner, watch-runner, lock-racer-runner, lease-runner.
			
 
				-  repeated string StressTypes = 101 [(gogoproto.moretags) = "yaml:\"stress-types\""];
			
 
				-  // StressKeySize is the size of each small key written into etcd.
			
 
				-  int32 StressKeySize = 102 [(gogoproto.moretags) = "yaml:\"stress-key-size\""];
			
 
				-  // StressKeySizeLarge is the size of each large key written into etcd.
			
 
				-  int32 StressKeySizeLarge = 103 [(gogoproto.moretags) = "yaml:\"stress-key-size-large\""];
			
 
				-  // StressKeySuffixRange is the count of key range written into etcd.
			
 
				-  // Stress keys are created with "fmt.Sprintf("foo%016x", rand.Intn(keySuffixRange)".
			
 
				-  int32 StressKeySuffixRange = 104 [(gogoproto.moretags) = "yaml:\"stress-key-suffix-range\""];
			
 
				-  // StressKeySuffixRangeTxn is the count of key range written into etcd txn (max 100).
			
 
				-  // Stress keys are created with "fmt.Sprintf("/k%03d", i)".
			
 
				-  int32 StressKeySuffixRangeTxn = 105 [(gogoproto.moretags) = "yaml:\"stress-key-suffix-range-txn\""];
			
 
				-  // StressKeyTxnOps is the number of operations per a transaction (max 64).
			
 
				-  int32 StressKeyTxnOps = 106 [(gogoproto.moretags) = "yaml:\"stress-key-txn-ops\""];
			
 
				-
			
 
				-  // StressClients is the number of concurrent stressing clients
			
 
				-  // with "one" shared TCP connection.
			
 
				-  int32 StressClients = 201 [(gogoproto.moretags) = "yaml:\"stress-clients\""];
			
 
				-  // StressQPS is the maximum number of stresser requests per second.
			
 
				-  int32 StressQPS = 202 [(gogoproto.moretags) = "yaml:\"stress-qps\""];
			
 
				-}
			
 
				-
			
 
				-message Request {
			
 
				-  Operation Operation = 1;
			
 
				-  // Member contains the same Member object from tester configuration.
			
 
				-  Member Member = 2;
			
 
				-  // Tester contains tester configuration.
			
 
				-  Tester Tester = 3;
			
 
				-}
			
 
				-
			
 
				-message Response {
			
 
				-  bool Success = 1;
			
 
				-  string Status = 2;
			
 
				-  // Member contains the same Member object from tester request.
			
 
				-  Member Member = 3;
			
 
				-}
			
--- a/functional/tester/cluster.go
+++ b/functional/tester/cluster.go
@@ -142,91 +142,91 @@ func (clus *Cluster) serveTesterServer() {
 
				 func (clus *Cluster) updateFailures() {
			
 
				 	for _, cs := range clus.Tester.FailureCases {
			
 
				 		switch cs {
			
 
				-		case "KILL_ONE_FOLLOWER":
			
 
				+		case "SIGTERM_ONE_FOLLOWER":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureKillOneFollower(clus))
			
 
				-		case "KILL_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT":
			
 
				+				new_FailureCase_SIGTERM_ONE_FOLLOWER(clus))
			
 
				+		case "SIGTERM_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureKillOneFollowerUntilTriggerSnapshot(clus))
			
 
				-		case "KILL_LEADER":
			
 
				+				new_FailureCase_SIGTERM_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT(clus))
			
 
				+		case "SIGTERM_LEADER":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureKillLeader(clus))
			
 
				-		case "KILL_LEADER_UNTIL_TRIGGER_SNAPSHOT":
			
 
				+				new_FailureCase_SIGTERM_LEADER(clus))
			
 
				+		case "SIGTERM_LEADER_UNTIL_TRIGGER_SNAPSHOT":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureKillLeaderUntilTriggerSnapshot(clus))
			
 
				-		case "KILL_QUORUM":
			
 
				+				new_FailureCase_SIGTERM_LEADER_UNTIL_TRIGGER_SNAPSHOT(clus))
			
 
				+		case "SIGTERM_QUORUM":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureKillQuorum(clus))
			
 
				-		case "KILL_ALL":
			
 
				+				new_FailureCase_SIGTERM_QUORUM(clus))
			
 
				+		case "SIGTERM_ALL":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureKillAll(clus))
			
 
				+				new_FailureCase_SIGTERM_ALL(clus))
			
 
				 
			
 
				 		case "BLACKHOLE_PEER_PORT_TX_RX_ONE_FOLLOWER":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureBlackholePeerPortTxRxOneFollower(clus))
			
 
				+				new_FailureCase_BLACKHOLE_PEER_PORT_TX_RX_ONE_FOLLOWER(clus))
			
 
				 		case "BLACKHOLE_PEER_PORT_TX_RX_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureBlackholePeerPortTxRxOneFollowerUntilTriggerSnapshot())
			
 
				+				new_FailureCase_BLACKHOLE_PEER_PORT_TX_RX_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT())
			
 
				 		case "BLACKHOLE_PEER_PORT_TX_RX_LEADER":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureBlackholePeerPortTxRxLeader(clus))
			
 
				+				new_FailureCase_BLACKHOLE_PEER_PORT_TX_RX_LEADER(clus))
			
 
				 		case "BLACKHOLE_PEER_PORT_TX_RX_LEADER_UNTIL_TRIGGER_SNAPSHOT":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureBlackholePeerPortTxRxLeaderUntilTriggerSnapshot())
			
 
				+				new_FailureCase_BLACKHOLE_PEER_PORT_TX_RX_LEADER_UNTIL_TRIGGER_SNAPSHOT())
			
 
				 		case "BLACKHOLE_PEER_PORT_TX_RX_QUORUM":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureBlackholePeerPortTxRxQuorum(clus))
			
 
				+				new_FailureCase_BLACKHOLE_PEER_PORT_TX_RX_QUORUM(clus))
			
 
				 		case "BLACKHOLE_PEER_PORT_TX_RX_ALL":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureBlackholePeerPortTxRxAll(clus))
			
 
				+				new_FailureCase_BLACKHOLE_PEER_PORT_TX_RX_ALL(clus))
			
 
				 
			
 
				 		case "DELAY_PEER_PORT_TX_RX_ONE_FOLLOWER":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureDelayPeerPortTxRxOneFollower(clus, false))
			
 
				+				new_FailureCase_DELAY_PEER_PORT_TX_RX_ONE_FOLLOWER(clus, false))
			
 
				 		case "RANDOM_DELAY_PEER_PORT_TX_RX_ONE_FOLLOWER":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureDelayPeerPortTxRxOneFollower(clus, true))
			
 
				+				new_FailureCase_DELAY_PEER_PORT_TX_RX_ONE_FOLLOWER(clus, true))
			
 
				 		case "DELAY_PEER_PORT_TX_RX_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureDelayPeerPortTxRxOneFollowerUntilTriggerSnapshot(clus, false))
			
 
				+				new_FailureCase_DELAY_PEER_PORT_TX_RX_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT(clus, false))
			
 
				 		case "RANDOM_DELAY_PEER_PORT_TX_RX_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureDelayPeerPortTxRxOneFollowerUntilTriggerSnapshot(clus, true))
			
 
				+				new_FailureCase_DELAY_PEER_PORT_TX_RX_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT(clus, true))
			
 
				 		case "DELAY_PEER_PORT_TX_RX_LEADER":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureDelayPeerPortTxRxLeader(clus, false))
			
 
				+				new_FailureCase_DELAY_PEER_PORT_TX_RX_LEADER(clus, false))
			
 
				 		case "RANDOM_DELAY_PEER_PORT_TX_RX_LEADER":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureDelayPeerPortTxRxLeader(clus, true))
			
 
				+				new_FailureCase_DELAY_PEER_PORT_TX_RX_LEADER(clus, true))
			
 
				 		case "DELAY_PEER_PORT_TX_RX_LEADER_UNTIL_TRIGGER_SNAPSHOT":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureDelayPeerPortTxRxLeaderUntilTriggerSnapshot(clus, false))
			
 
				+				new_FailureCase_DELAY_PEER_PORT_TX_RX_LEADER_UNTIL_TRIGGER_SNAPSHOT(clus, false))
			
 
				 		case "RANDOM_DELAY_PEER_PORT_TX_RX_LEADER_UNTIL_TRIGGER_SNAPSHOT":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureDelayPeerPortTxRxLeaderUntilTriggerSnapshot(clus, true))
			
 
				+				new_FailureCase_DELAY_PEER_PORT_TX_RX_LEADER_UNTIL_TRIGGER_SNAPSHOT(clus, true))
			
 
				 		case "DELAY_PEER_PORT_TX_RX_QUORUM":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureDelayPeerPortTxRxQuorum(clus, false))
			
 
				+				new_FailureCase_DELAY_PEER_PORT_TX_RX_QUORUM(clus, false))
			
 
				 		case "RANDOM_DELAY_PEER_PORT_TX_RX_QUORUM":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureDelayPeerPortTxRxQuorum(clus, true))
			
 
				+				new_FailureCase_DELAY_PEER_PORT_TX_RX_QUORUM(clus, true))
			
 
				 		case "DELAY_PEER_PORT_TX_RX_ALL":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureDelayPeerPortTxRxAll(clus, false))
			
 
				+				new_FailureCase_DELAY_PEER_PORT_TX_RX_ALL(clus, false))
			
 
				 		case "RANDOM_DELAY_PEER_PORT_TX_RX_ALL":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureDelayPeerPortTxRxAll(clus, true))
			
 
				+				new_FailureCase_DELAY_PEER_PORT_TX_RX_ALL(clus, true))
			
 
				 
			
 
				 		case "NO_FAIL_WITH_STRESS":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureNoFailWithStress(clus))
			
 
				+				new_FailureCase_NO_FAIL_WITH_STRESS(clus))
			
 
				 		case "NO_FAIL_WITH_NO_STRESS_FOR_LIVENESS":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureNoFailWithNoStressForLiveness(clus))
			
 
				+				new_FailureCase_NO_FAIL_WITH_NO_STRESS_FOR_LIVENESS(clus))
			
 
				 
			
 
				 		case "EXTERNAL":
			
 
				 			clus.failures = append(clus.failures,
			
 
				-				newFailureExternal(clus.Tester.ExternalExecPath))
			
 
				+				new_FailureCase_EXTERNAL(clus.Tester.ExternalExecPath))
			
 
				 		case "FAILPOINTS":
			
 
				 			fpFailures, fperr := failpointFailures(clus)
			
 
				 			if len(fpFailures) == 0 {
			
@@ -310,24 +310,24 @@ func (clus *Cluster) checkConsistency() (err error) {
 
				 	return err
			
 
				 }
			
 
				 
			
 
				-// Bootstrap bootstraps etcd cluster the very first time.
			
 
				+// Send_INITIAL_START_ETCD bootstraps etcd cluster the very first time.
			
 
				 // After this, just continue to call kill/restart.
			
 
				-func (clus *Cluster) Bootstrap() error {
			
 
				+func (clus *Cluster) Send_INITIAL_START_ETCD() error {
			
 
				 	// this is the only time that creates request from scratch
			
 
				-	return clus.broadcastOperation(rpcpb.Operation_InitialStartEtcd)
			
 
				+	return clus.broadcast(rpcpb.Operation_INITIAL_START_ETCD)
			
 
				 }
			
 
				 
			
 
				-// FailArchive sends "FailArchive" operation.
			
 
				-func (clus *Cluster) FailArchive() error {
			
 
				-	return clus.broadcastOperation(rpcpb.Operation_FailArchive)
			
 
				+// send_SIGQUIT_ETCD_AND_ARCHIVE_DATA sends "send_SIGQUIT_ETCD_AND_ARCHIVE_DATA" operation.
			
 
				+func (clus *Cluster) send_SIGQUIT_ETCD_AND_ARCHIVE_DATA() error {
			
 
				+	return clus.broadcast(rpcpb.Operation_SIGQUIT_ETCD_AND_ARCHIVE_DATA)
			
 
				 }
			
 
				 
			
 
				-// Restart sends "Restart" operation.
			
 
				-func (clus *Cluster) Restart() error {
			
 
				-	return clus.broadcastOperation(rpcpb.Operation_RestartEtcd)
			
 
				+// send_RESTART_ETCD sends restart operation.
			
 
				+func (clus *Cluster) send_RESTART_ETCD() error {
			
 
				+	return clus.broadcast(rpcpb.Operation_RESTART_ETCD)
			
 
				 }
			
 
				 
			
 
				-func (clus *Cluster) broadcastOperation(op rpcpb.Operation) error {
			
 
				+func (clus *Cluster) broadcast(op rpcpb.Operation) error {
			
 
				 	var wg sync.WaitGroup
			
 
				 	wg.Add(len(clus.agentStreams))
			
 
				 
			
@@ -335,7 +335,7 @@ func (clus *Cluster) broadcastOperation(op rpcpb.Operation) error {
 
				 	for i := range clus.agentStreams {
			
 
				 		go func(idx int, o rpcpb.Operation) {
			
 
				 			defer wg.Done()
			
 
				-			errc <- clus.sendOperation(idx, o)
			
 
				+			errc <- clus.sendOp(idx, o)
			
 
				 		}(i, op)
			
 
				 	}
			
 
				 	wg.Wait()
			
@@ -349,7 +349,7 @@ func (clus *Cluster) broadcastOperation(op rpcpb.Operation) error {
 
				 
			
 
				 		if err != nil {
			
 
				 			destroyed := false
			
 
				-			if op == rpcpb.Operation_DestroyEtcdAgent {
			
 
				+			if op == rpcpb.Operation_SIGQUIT_ETCD_AND_REMOVE_DATA_AND_STOP_AGENT {
			
 
				 				if err == io.EOF {
			
 
				 					destroyed = true
			
 
				 				}
			
@@ -376,8 +376,8 @@ func (clus *Cluster) broadcastOperation(op rpcpb.Operation) error {
 
				 	return errors.New(strings.Join(errs, ", "))
			
 
				 }
			
 
				 
			
 
				-func (clus *Cluster) sendOperation(idx int, op rpcpb.Operation) error {
			
 
				-	if op == rpcpb.Operation_InitialStartEtcd {
			
 
				+func (clus *Cluster) sendOp(idx int, op rpcpb.Operation) error {
			
 
				+	if op == rpcpb.Operation_INITIAL_START_ETCD {
			
 
				 		clus.agentRequests[idx] = &rpcpb.Request{
			
 
				 			Operation: op,
			
 
				 			Member:    clus.Members[idx],
			
@@ -436,7 +436,7 @@ func (clus *Cluster) sendOperation(idx int, op rpcpb.Operation) error {
 
				 	}
			
 
				 
			
 
				 	// store TLS assets from agents/servers onto disk
			
 
				-	if secure && (op == rpcpb.Operation_InitialStartEtcd || op == rpcpb.Operation_RestartEtcd) {
			
 
				+	if secure && (op == rpcpb.Operation_INITIAL_START_ETCD || op == rpcpb.Operation_RESTART_ETCD) {
			
 
				 		dirClient := filepath.Join(
			
 
				 			clus.Tester.DataDir,
			
 
				 			clus.Members[idx].Etcd.Name,
			
@@ -496,9 +496,9 @@ func (clus *Cluster) sendOperation(idx int, op rpcpb.Operation) error {
 
				 	return nil
			
 
				 }
			
 
				 
			
 
				-// DestroyEtcdAgents terminates all tester connections to agents and etcd servers.
			
 
				-func (clus *Cluster) DestroyEtcdAgents() {
			
 
				-	err := clus.broadcastOperation(rpcpb.Operation_DestroyEtcdAgent)
			
 
				+// Send_SIGQUIT_ETCD_AND_REMOVE_DATA_AND_STOP_AGENT terminates all tester connections to agents and etcd servers.
			
 
				+func (clus *Cluster) Send_SIGQUIT_ETCD_AND_REMOVE_DATA_AND_STOP_AGENT() {
			
 
				+	err := clus.broadcast(rpcpb.Operation_SIGQUIT_ETCD_AND_REMOVE_DATA_AND_STOP_AGENT)
			
 
				 	if err != nil {
			
 
				 		clus.lg.Warn("destroying etcd/agents FAIL", zap.Error(err))
			
 
				 	} else {
			
--- a/functional/tester/cluster_run.go
+++ b/functional/tester/cluster_run.go
@@ -316,7 +316,7 @@ func (clus *Cluster) failed() {
 
				 		zap.Int("case", clus.cs),
			
 
				 		zap.Int("case-total", len(clus.failures)),
			
 
				 	)
			
 
				-	clus.DestroyEtcdAgents()
			
 
				+	clus.Send_SIGQUIT_ETCD_AND_REMOVE_DATA_AND_STOP_AGENT()
			
 
				 
			
 
				 	os.Exit(2)
			
 
				 }
			
@@ -341,7 +341,7 @@ func (clus *Cluster) cleanup() error {
 
				 	)
			
 
				 	clus.stresser.Close()
			
 
				 
			
 
				-	if err := clus.FailArchive(); err != nil {
			
 
				+	if err := clus.send_SIGQUIT_ETCD_AND_ARCHIVE_DATA(); err != nil {
			
 
				 		clus.lg.Warn(
			
 
				 			"cleanup FAIL",
			
 
				 			zap.Int("round", clus.rd),
			
@@ -351,7 +351,7 @@ func (clus *Cluster) cleanup() error {
 
				 		)
			
 
				 		return err
			
 
				 	}
			
 
				-	if err := clus.Restart(); err != nil {
			
 
				+	if err := clus.send_RESTART_ETCD(); err != nil {
			
 
				 		clus.lg.Warn(
			
 
				 			"restart FAIL",
			
 
				 			zap.Int("round", clus.rd),
			
--- a/functional/tester/cluster_test.go
+++ b/functional/tester/cluster_test.go
@@ -156,12 +156,12 @@ func Test_read(t *testing.T) {
 
				 			FailureDelayMs:        7000,
			
 
				 			FailureShuffle:        true,
			
 
				 			FailureCases: []string{
			
 
				-				"KILL_ONE_FOLLOWER",
			
 
				-				"KILL_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT",
			
 
				-				"KILL_LEADER",
			
 
				-				"KILL_LEADER_UNTIL_TRIGGER_SNAPSHOT",
			
 
				-				"KILL_QUORUM",
			
 
				-				"KILL_ALL",
			
 
				+				"SIGTERM_ONE_FOLLOWER",
			
 
				+				"SIGTERM_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT",
			
 
				+				"SIGTERM_LEADER",
			
 
				+				"SIGTERM_LEADER_UNTIL_TRIGGER_SNAPSHOT",
			
 
				+				"SIGTERM_QUORUM",
			
 
				+				"SIGTERM_ALL",
			
 
				 				"BLACKHOLE_PEER_PORT_TX_RX_ONE_FOLLOWER",
			
 
				 				"BLACKHOLE_PEER_PORT_TX_RX_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT",
			
 
				 				"BLACKHOLE_PEER_PORT_TX_RX_LEADER",
			
--- a/functional/tester/failure_case_external.go
+++ b/functional/tester/failure_case_external.go
@@ -46,7 +46,7 @@ func (f *failureExternal) FailureCase() rpcpb.FailureCase {
 
				 	return f.failureCase
			
 
				 }
			
 
				 
			
 
				-func newFailureExternal(scriptPath string) Failure {
			
 
				+func new_FailureCase_EXTERNAL(scriptPath string) Failure {
			
 
				 	return &failureExternal{
			
 
				 		desc:        fmt.Sprintf("external fault injector (script: %q)", scriptPath),
			
 
				 		failureCase: rpcpb.FailureCase_EXTERNAL,
			
--- a/functional/tester/failure_case_failpoints.go
+++ b/functional/tester/failure_case_failpoints.go
@@ -145,7 +145,7 @@ func makeRecoverFailpoint(fp string) recoverMemberFunc {
 
				 		fpStats.mu.Lock()
			
 
				 		fpStats.crashes[fp]++
			
 
				 		fpStats.mu.Unlock()
			
 
				-		return recoverKill(clus, idx)
			
 
				+		return recover_SIGTERM_ETCD(clus, idx)
			
 
				 	}
			
 
				 }
			
 
				 
			
--- a/functional/tester/failure_case_kill.go
+++ b/functional/tester/failure_case_kill.go
@@ -1,89 +0,0 @@
 
				-// Copyright 2018 The etcd Authors
			
 
				-//
			
 
				-// Licensed under the Apache License, Version 2.0 (the "License");
			
 
				-// you may not use this file except in compliance with the License.
			
 
				-// You may obtain a copy of the License at
			
 
				-//
			
 
				-//     http://www.apache.org/licenses/LICENSE-2.0
			
 
				-//
			
 
				-// Unless required by applicable law or agreed to in writing, software
			
 
				-// distributed under the License is distributed on an "AS IS" BASIS,
			
 
				-// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
			
 
				-// See the License for the specific language governing permissions and
			
 
				-// limitations under the License.
			
 
				-
			
 
				-package tester
			
 
				-
			
 
				-import "github.com/coreos/etcd/functional/rpcpb"
			
 
				-
			
 
				-func injectKill(clus *Cluster, idx int) error {
			
 
				-	return clus.sendOperation(idx, rpcpb.Operation_KillEtcd)
			
 
				-}
			
 
				-
			
 
				-func recoverKill(clus *Cluster, idx int) error {
			
 
				-	return clus.sendOperation(idx, rpcpb.Operation_RestartEtcd)
			
 
				-}
			
 
				-
			
 
				-func newFailureKillOneFollower(clus *Cluster) Failure {
			
 
				-	ff := failureByFunc{
			
 
				-		failureCase:   rpcpb.FailureCase_KILL_ONE_FOLLOWER,
			
 
				-		injectMember:  injectKill,
			
 
				-		recoverMember: recoverKill,
			
 
				-	}
			
 
				-	f := &failureFollower{ff, -1, -1}
			
 
				-	return &failureDelay{
			
 
				-		Failure:       f,
			
 
				-		delayDuration: clus.GetFailureDelayDuration(),
			
 
				-	}
			
 
				-}
			
 
				-
			
 
				-func newFailureKillLeader(clus *Cluster) Failure {
			
 
				-	ff := failureByFunc{
			
 
				-		failureCase:   rpcpb.FailureCase_KILL_LEADER,
			
 
				-		injectMember:  injectKill,
			
 
				-		recoverMember: recoverKill,
			
 
				-	}
			
 
				-	f := &failureLeader{ff, -1, -1}
			
 
				-	return &failureDelay{
			
 
				-		Failure:       f,
			
 
				-		delayDuration: clus.GetFailureDelayDuration(),
			
 
				-	}
			
 
				-}
			
 
				-
			
 
				-func newFailureKillQuorum(clus *Cluster) Failure {
			
 
				-	f := &failureQuorum{
			
 
				-		failureCase:   rpcpb.FailureCase_KILL_QUORUM,
			
 
				-		injectMember:  injectKill,
			
 
				-		recoverMember: recoverKill,
			
 
				-	}
			
 
				-	return &failureDelay{
			
 
				-		Failure:       f,
			
 
				-		delayDuration: clus.GetFailureDelayDuration(),
			
 
				-	}
			
 
				-}
			
 
				-
			
 
				-func newFailureKillAll(clus *Cluster) Failure {
			
 
				-	f := &failureAll{
			
 
				-		failureCase:   rpcpb.FailureCase_KILL_ALL,
			
 
				-		injectMember:  injectKill,
			
 
				-		recoverMember: recoverKill,
			
 
				-	}
			
 
				-	return &failureDelay{
			
 
				-		Failure:       f,
			
 
				-		delayDuration: clus.GetFailureDelayDuration(),
			
 
				-	}
			
 
				-}
			
 
				-
			
 
				-func newFailureKillOneFollowerUntilTriggerSnapshot(clus *Cluster) Failure {
			
 
				-	return &failureUntilSnapshot{
			
 
				-		failureCase: rpcpb.FailureCase_KILL_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT,
			
 
				-		Failure:     newFailureKillOneFollower(clus),
			
 
				-	}
			
 
				-}
			
 
				-
			
 
				-func newFailureKillLeaderUntilTriggerSnapshot(clus *Cluster) Failure {
			
 
				-	return &failureUntilSnapshot{
			
 
				-		failureCase: rpcpb.FailureCase_KILL_LEADER_UNTIL_TRIGGER_SNAPSHOT,
			
 
				-		Failure:     newFailureKillLeader(clus),
			
 
				-	}
			
 
				-}
			
--- a/functional/tester/failure_case_network_blackhole.go
+++ b/functional/tester/failure_case_network_blackhole.go
@@ -16,19 +16,19 @@ package tester
 
				 
			
 
				 import "github.com/coreos/etcd/functional/rpcpb"
			
 
				 
			
 
				-func injectBlackholePeerPortTxRx(clus *Cluster, idx int) error {
			
 
				-	return clus.sendOperation(idx, rpcpb.Operation_BlackholePeerPortTxRx)
			
 
				+func inject_BLACKHOLE_PEER_PORT_TX_RX(clus *Cluster, idx int) error {
			
 
				+	return clus.sendOp(idx, rpcpb.Operation_BLACKHOLE_PEER_PORT_TX_RX)
			
 
				 }
			
 
				 
			
 
				-func recoverBlackholePeerPortTxRx(clus *Cluster, idx int) error {
			
 
				-	return clus.sendOperation(idx, rpcpb.Operation_UnblackholePeerPortTxRx)
			
 
				+func recover_BLACKHOLE_PEER_PORT_TX_RX(clus *Cluster, idx int) error {
			
 
				+	return clus.sendOp(idx, rpcpb.Operation_UNBLACKHOLE_PEER_PORT_TX_RX)
			
 
				 }
			
 
				 
			
 
				-func newFailureBlackholePeerPortTxRxOneFollower(clus *Cluster) Failure {
			
 
				+func new_FailureCase_BLACKHOLE_PEER_PORT_TX_RX_ONE_FOLLOWER(clus *Cluster) Failure {
			
 
				 	ff := failureByFunc{
			
 
				 		failureCase:   rpcpb.FailureCase_BLACKHOLE_PEER_PORT_TX_RX_ONE_FOLLOWER,
			
 
				-		injectMember:  injectBlackholePeerPortTxRx,
			
 
				-		recoverMember: recoverBlackholePeerPortTxRx,
			
 
				+		injectMember:  inject_BLACKHOLE_PEER_PORT_TX_RX,
			
 
				+		recoverMember: recover_BLACKHOLE_PEER_PORT_TX_RX,
			
 
				 	}
			
 
				 	f := &failureFollower{ff, -1, -1}
			
 
				 	return &failureDelay{
			
@@ -37,11 +37,11 @@ func newFailureBlackholePeerPortTxRxOneFollower(clus *Cluster) Failure {
 
				 	}
			
 
				 }
			
 
				 
			
 
				-func newFailureBlackholePeerPortTxRxOneFollowerUntilTriggerSnapshot() Failure {
			
 
				+func new_FailureCase_BLACKHOLE_PEER_PORT_TX_RX_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT() Failure {
			
 
				 	ff := failureByFunc{
			
 
				 		failureCase:   rpcpb.FailureCase_BLACKHOLE_PEER_PORT_TX_RX_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT,
			
 
				-		injectMember:  injectBlackholePeerPortTxRx,
			
 
				-		recoverMember: recoverBlackholePeerPortTxRx,
			
 
				+		injectMember:  inject_BLACKHOLE_PEER_PORT_TX_RX,
			
 
				+		recoverMember: recover_BLACKHOLE_PEER_PORT_TX_RX,
			
 
				 	}
			
 
				 	f := &failureFollower{ff, -1, -1}
			
 
				 	return &failureUntilSnapshot{
			
@@ -50,11 +50,11 @@ func newFailureBlackholePeerPortTxRxOneFollowerUntilTriggerSnapshot() Failure {
 
				 	}
			
 
				 }
			
 
				 
			
 
				-func newFailureBlackholePeerPortTxRxLeader(clus *Cluster) Failure {
			
 
				+func new_FailureCase_BLACKHOLE_PEER_PORT_TX_RX_LEADER(clus *Cluster) Failure {
			
 
				 	ff := failureByFunc{
			
 
				 		failureCase:   rpcpb.FailureCase_BLACKHOLE_PEER_PORT_TX_RX_LEADER,
			
 
				-		injectMember:  injectBlackholePeerPortTxRx,
			
 
				-		recoverMember: recoverBlackholePeerPortTxRx,
			
 
				+		injectMember:  inject_BLACKHOLE_PEER_PORT_TX_RX,
			
 
				+		recoverMember: recover_BLACKHOLE_PEER_PORT_TX_RX,
			
 
				 	}
			
 
				 	f := &failureLeader{ff, -1, -1}
			
 
				 	return &failureDelay{
			
@@ -63,11 +63,11 @@ func newFailureBlackholePeerPortTxRxLeader(clus *Cluster) Failure {
 
				 	}
			
 
				 }
			
 
				 
			
 
				-func newFailureBlackholePeerPortTxRxLeaderUntilTriggerSnapshot() Failure {
			
 
				+func new_FailureCase_BLACKHOLE_PEER_PORT_TX_RX_LEADER_UNTIL_TRIGGER_SNAPSHOT() Failure {
			
 
				 	ff := failureByFunc{
			
 
				 		failureCase:   rpcpb.FailureCase_BLACKHOLE_PEER_PORT_TX_RX_LEADER_UNTIL_TRIGGER_SNAPSHOT,
			
 
				-		injectMember:  injectBlackholePeerPortTxRx,
			
 
				-		recoverMember: recoverBlackholePeerPortTxRx,
			
 
				+		injectMember:  inject_BLACKHOLE_PEER_PORT_TX_RX,
			
 
				+		recoverMember: recover_BLACKHOLE_PEER_PORT_TX_RX,
			
 
				 	}
			
 
				 	f := &failureLeader{ff, -1, -1}
			
 
				 	return &failureUntilSnapshot{
			
@@ -76,11 +76,11 @@ func newFailureBlackholePeerPortTxRxLeaderUntilTriggerSnapshot() Failure {
 
				 	}
			
 
				 }
			
 
				 
			
 
				-func newFailureBlackholePeerPortTxRxQuorum(clus *Cluster) Failure {
			
 
				+func new_FailureCase_BLACKHOLE_PEER_PORT_TX_RX_QUORUM(clus *Cluster) Failure {
			
 
				 	f := &failureQuorum{
			
 
				 		failureCase:   rpcpb.FailureCase_BLACKHOLE_PEER_PORT_TX_RX_QUORUM,
			
 
				-		injectMember:  injectBlackholePeerPortTxRx,
			
 
				-		recoverMember: recoverBlackholePeerPortTxRx,
			
 
				+		injectMember:  inject_BLACKHOLE_PEER_PORT_TX_RX,
			
 
				+		recoverMember: recover_BLACKHOLE_PEER_PORT_TX_RX,
			
 
				 	}
			
 
				 	return &failureDelay{
			
 
				 		Failure:       f,
			
@@ -88,11 +88,11 @@ func newFailureBlackholePeerPortTxRxQuorum(clus *Cluster) Failure {
 
				 	}
			
 
				 }
			
 
				 
			
 
				-func newFailureBlackholePeerPortTxRxAll(clus *Cluster) Failure {
			
 
				+func new_FailureCase_BLACKHOLE_PEER_PORT_TX_RX_ALL(clus *Cluster) Failure {
			
 
				 	f := &failureAll{
			
 
				 		failureCase:   rpcpb.FailureCase_BLACKHOLE_PEER_PORT_TX_RX_ALL,
			
 
				-		injectMember:  injectBlackholePeerPortTxRx,
			
 
				-		recoverMember: recoverBlackholePeerPortTxRx,
			
 
				+		injectMember:  inject_BLACKHOLE_PEER_PORT_TX_RX,
			
 
				+		recoverMember: recover_BLACKHOLE_PEER_PORT_TX_RX,
			
 
				 	}
			
 
				 	return &failureDelay{
			
 
				 		Failure:       f,
			
--- a/functional/tester/failure_case_network_delay.go
+++ b/functional/tester/failure_case_network_delay.go
@@ -30,27 +30,27 @@ const (
 
				 	waitRecover = 5 * time.Second
			
 
				 )
			
 
				 
			
 
				-func injectDelayPeerPortTxRx(clus *Cluster, idx int) error {
			
 
				+func inject_DELAY_PEER_PORT_TX_RX(clus *Cluster, idx int) error {
			
 
				 	clus.lg.Info(
			
 
				 		"injecting delay latency",
			
 
				 		zap.Duration("latency", time.Duration(clus.Tester.UpdatedDelayLatencyMs)*time.Millisecond),
			
 
				 		zap.Duration("latency-rv", time.Duration(clus.Tester.DelayLatencyMsRv)*time.Millisecond),
			
 
				 		zap.String("endpoint", clus.Members[idx].EtcdClientEndpoint),
			
 
				 	)
			
 
				-	return clus.sendOperation(idx, rpcpb.Operation_DelayPeerPortTxRx)
			
 
				+	return clus.sendOp(idx, rpcpb.Operation_DELAY_PEER_PORT_TX_RX)
			
 
				 }
			
 
				 
			
 
				-func recoverDelayPeerPortTxRx(clus *Cluster, idx int) error {
			
 
				-	err := clus.sendOperation(idx, rpcpb.Operation_UndelayPeerPortTxRx)
			
 
				+func recover_DELAY_PEER_PORT_TX_RX(clus *Cluster, idx int) error {
			
 
				+	err := clus.sendOp(idx, rpcpb.Operation_UNDELAY_PEER_PORT_TX_RX)
			
 
				 	time.Sleep(waitRecover)
			
 
				 	return err
			
 
				 }
			
 
				 
			
 
				-func newFailureDelayPeerPortTxRxOneFollower(clus *Cluster, random bool) Failure {
			
 
				+func new_FailureCase_DELAY_PEER_PORT_TX_RX_ONE_FOLLOWER(clus *Cluster, random bool) Failure {
			
 
				 	ff := failureByFunc{
			
 
				 		failureCase:   rpcpb.FailureCase_DELAY_PEER_PORT_TX_RX_ONE_FOLLOWER,
			
 
				-		injectMember:  injectDelayPeerPortTxRx,
			
 
				-		recoverMember: recoverDelayPeerPortTxRx,
			
 
				+		injectMember:  inject_DELAY_PEER_PORT_TX_RX,
			
 
				+		recoverMember: recover_DELAY_PEER_PORT_TX_RX,
			
 
				 	}
			
 
				 	clus.Tester.UpdatedDelayLatencyMs = clus.Tester.DelayLatencyMs
			
 
				 	if random {
			
@@ -64,11 +64,11 @@ func newFailureDelayPeerPortTxRxOneFollower(clus *Cluster, random bool) Failure
 
				 	}
			
 
				 }
			
 
				 
			
 
				-func newFailureDelayPeerPortTxRxOneFollowerUntilTriggerSnapshot(clus *Cluster, random bool) Failure {
			
 
				+func new_FailureCase_DELAY_PEER_PORT_TX_RX_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT(clus *Cluster, random bool) Failure {
			
 
				 	ff := failureByFunc{
			
 
				 		failureCase:   rpcpb.FailureCase_DELAY_PEER_PORT_TX_RX_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT,
			
 
				-		injectMember:  injectDelayPeerPortTxRx,
			
 
				-		recoverMember: recoverDelayPeerPortTxRx,
			
 
				+		injectMember:  inject_DELAY_PEER_PORT_TX_RX,
			
 
				+		recoverMember: recover_DELAY_PEER_PORT_TX_RX,
			
 
				 	}
			
 
				 	clus.Tester.UpdatedDelayLatencyMs = clus.Tester.DelayLatencyMs
			
 
				 	if random {
			
@@ -82,11 +82,11 @@ func newFailureDelayPeerPortTxRxOneFollowerUntilTriggerSnapshot(clus *Cluster, r
 
				 	}
			
 
				 }
			
 
				 
			
 
				-func newFailureDelayPeerPortTxRxLeader(clus *Cluster, random bool) Failure {
			
 
				+func new_FailureCase_DELAY_PEER_PORT_TX_RX_LEADER(clus *Cluster, random bool) Failure {
			
 
				 	ff := failureByFunc{
			
 
				 		failureCase:   rpcpb.FailureCase_DELAY_PEER_PORT_TX_RX_LEADER,
			
 
				-		injectMember:  injectDelayPeerPortTxRx,
			
 
				-		recoverMember: recoverDelayPeerPortTxRx,
			
 
				+		injectMember:  inject_DELAY_PEER_PORT_TX_RX,
			
 
				+		recoverMember: recover_DELAY_PEER_PORT_TX_RX,
			
 
				 	}
			
 
				 	clus.Tester.UpdatedDelayLatencyMs = clus.Tester.DelayLatencyMs
			
 
				 	if random {
			
@@ -100,11 +100,11 @@ func newFailureDelayPeerPortTxRxLeader(clus *Cluster, random bool) Failure {
 
				 	}
			
 
				 }
			
 
				 
			
 
				-func newFailureDelayPeerPortTxRxLeaderUntilTriggerSnapshot(clus *Cluster, random bool) Failure {
			
 
				+func new_FailureCase_DELAY_PEER_PORT_TX_RX_LEADER_UNTIL_TRIGGER_SNAPSHOT(clus *Cluster, random bool) Failure {
			
 
				 	ff := failureByFunc{
			
 
				 		failureCase:   rpcpb.FailureCase_DELAY_PEER_PORT_TX_RX_LEADER_UNTIL_TRIGGER_SNAPSHOT,
			
 
				-		injectMember:  injectDelayPeerPortTxRx,
			
 
				-		recoverMember: recoverDelayPeerPortTxRx,
			
 
				+		injectMember:  inject_DELAY_PEER_PORT_TX_RX,
			
 
				+		recoverMember: recover_DELAY_PEER_PORT_TX_RX,
			
 
				 	}
			
 
				 	clus.Tester.UpdatedDelayLatencyMs = clus.Tester.DelayLatencyMs
			
 
				 	if random {
			
@@ -118,11 +118,11 @@ func newFailureDelayPeerPortTxRxLeaderUntilTriggerSnapshot(clus *Cluster, random
 
				 	}
			
 
				 }
			
 
				 
			
 
				-func newFailureDelayPeerPortTxRxQuorum(clus *Cluster, random bool) Failure {
			
 
				+func new_FailureCase_DELAY_PEER_PORT_TX_RX_QUORUM(clus *Cluster, random bool) Failure {
			
 
				 	f := &failureQuorum{
			
 
				 		failureCase:   rpcpb.FailureCase_DELAY_PEER_PORT_TX_RX_QUORUM,
			
 
				-		injectMember:  injectDelayPeerPortTxRx,
			
 
				-		recoverMember: recoverDelayPeerPortTxRx,
			
 
				+		injectMember:  inject_DELAY_PEER_PORT_TX_RX,
			
 
				+		recoverMember: recover_DELAY_PEER_PORT_TX_RX,
			
 
				 	}
			
 
				 	clus.Tester.UpdatedDelayLatencyMs = clus.Tester.DelayLatencyMs
			
 
				 	if random {
			
@@ -135,11 +135,11 @@ func newFailureDelayPeerPortTxRxQuorum(clus *Cluster, random bool) Failure {
 
				 	}
			
 
				 }
			
 
				 
			
 
				-func newFailureDelayPeerPortTxRxAll(clus *Cluster, random bool) Failure {
			
 
				+func new_FailureCase_DELAY_PEER_PORT_TX_RX_ALL(clus *Cluster, random bool) Failure {
			
 
				 	f := &failureAll{
			
 
				 		failureCase:   rpcpb.FailureCase_DELAY_PEER_PORT_TX_RX_ALL,
			
 
				-		injectMember:  injectDelayPeerPortTxRx,
			
 
				-		recoverMember: recoverDelayPeerPortTxRx,
			
 
				+		injectMember:  inject_DELAY_PEER_PORT_TX_RX,
			
 
				+		recoverMember: recover_DELAY_PEER_PORT_TX_RX,
			
 
				 	}
			
 
				 	clus.Tester.UpdatedDelayLatencyMs = clus.Tester.DelayLatencyMs
			
 
				 	if random {
			
--- a/functional/tester/failure_case_no_fail.go
+++ b/functional/tester/failure_case_no_fail.go
@@ -43,7 +43,7 @@ func (f *failureNoFailWithStress) FailureCase() rpcpb.FailureCase {
 
				 	return f.failureCase
			
 
				 }
			
 
				 
			
 
				-func newFailureNoFailWithStress(clus *Cluster) Failure {
			
 
				+func new_FailureCase_NO_FAIL_WITH_STRESS(clus *Cluster) Failure {
			
 
				 	f := &failureNoFailWithStress{
			
 
				 		failureCase: rpcpb.FailureCase_NO_FAIL_WITH_STRESS,
			
 
				 	}
			
@@ -88,7 +88,7 @@ func (f *failureNoFailWithNoStressForLiveness) FailureCase() rpcpb.FailureCase {
 
				 	return f.failureCase
			
 
				 }
			
 
				 
			
 
				-func newFailureNoFailWithNoStressForLiveness(clus *Cluster) Failure {
			
 
				+func new_FailureCase_NO_FAIL_WITH_NO_STRESS_FOR_LIVENESS(clus *Cluster) Failure {
			
 
				 	f := &failureNoFailWithNoStressForLiveness{
			
 
				 		failureCase: rpcpb.FailureCase_NO_FAIL_WITH_NO_STRESS_FOR_LIVENESS,
			
 
				 	}
			
--- a/functional/tester/failure_case_sigterm.go
+++ b/functional/tester/failure_case_sigterm.go
@@ -0,0 +1,89 @@
 
				+// Copyright 2018 The etcd Authors
			
 
				+//
			
 
				+// Licensed under the Apache License, Version 2.0 (the "License");
			
 
				+// you may not use this file except in compliance with the License.
			
 
				+// You may obtain a copy of the License at
			
 
				+//
			
 
				+//     http://www.apache.org/licenses/LICENSE-2.0
			
 
				+//
			
 
				+// Unless required by applicable law or agreed to in writing, software
			
 
				+// distributed under the License is distributed on an "AS IS" BASIS,
			
 
				+// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
			
 
				+// See the License for the specific language governing permissions and
			
 
				+// limitations under the License.
			
 
				+
			
 
				+package tester
			
 
				+
			
 
				+import "github.com/coreos/etcd/functional/rpcpb"
			
 
				+
			
 
				+func inject_SIGTERM_ETCD(clus *Cluster, idx int) error {
			
 
				+	return clus.sendOp(idx, rpcpb.Operation_SIGTERM_ETCD)
			
 
				+}
			
 
				+
			
 
				+func recover_SIGTERM_ETCD(clus *Cluster, idx int) error {
			
 
				+	return clus.sendOp(idx, rpcpb.Operation_RESTART_ETCD)
			
 
				+}
			
 
				+
			
 
				+func new_FailureCase_SIGTERM_ONE_FOLLOWER(clus *Cluster) Failure {
			
 
				+	ff := failureByFunc{
			
 
				+		failureCase:   rpcpb.FailureCase_SIGTERM_ONE_FOLLOWER,
			
 
				+		injectMember:  inject_SIGTERM_ETCD,
			
 
				+		recoverMember: recover_SIGTERM_ETCD,
			
 
				+	}
			
 
				+	f := &failureFollower{ff, -1, -1}
			
 
				+	return &failureDelay{
			
 
				+		Failure:       f,
			
 
				+		delayDuration: clus.GetFailureDelayDuration(),
			
 
				+	}
			
 
				+}
			
 
				+
			
 
				+func new_FailureCase_SIGTERM_LEADER(clus *Cluster) Failure {
			
 
				+	ff := failureByFunc{
			
 
				+		failureCase:   rpcpb.FailureCase_SIGTERM_LEADER,
			
 
				+		injectMember:  inject_SIGTERM_ETCD,
			
 
				+		recoverMember: recover_SIGTERM_ETCD,
			
 
				+	}
			
 
				+	f := &failureLeader{ff, -1, -1}
			
 
				+	return &failureDelay{
			
 
				+		Failure:       f,
			
 
				+		delayDuration: clus.GetFailureDelayDuration(),
			
 
				+	}
			
 
				+}
			
 
				+
			
 
				+func new_FailureCase_SIGTERM_QUORUM(clus *Cluster) Failure {
			
 
				+	f := &failureQuorum{
			
 
				+		failureCase:   rpcpb.FailureCase_SIGTERM_QUORUM,
			
 
				+		injectMember:  inject_SIGTERM_ETCD,
			
 
				+		recoverMember: recover_SIGTERM_ETCD,
			
 
				+	}
			
 
				+	return &failureDelay{
			
 
				+		Failure:       f,
			
 
				+		delayDuration: clus.GetFailureDelayDuration(),
			
 
				+	}
			
 
				+}
			
 
				+
			
 
				+func new_FailureCase_SIGTERM_ALL(clus *Cluster) Failure {
			
 
				+	f := &failureAll{
			
 
				+		failureCase:   rpcpb.FailureCase_SIGTERM_ALL,
			
 
				+		injectMember:  inject_SIGTERM_ETCD,
			
 
				+		recoverMember: recover_SIGTERM_ETCD,
			
 
				+	}
			
 
				+	return &failureDelay{
			
 
				+		Failure:       f,
			
 
				+		delayDuration: clus.GetFailureDelayDuration(),
			
 
				+	}
			
 
				+}
			
 
				+
			
 
				+func new_FailureCase_SIGTERM_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT(clus *Cluster) Failure {
			
 
				+	return &failureUntilSnapshot{
			
 
				+		failureCase: rpcpb.FailureCase_SIGTERM_ONE_FOLLOWER_UNTIL_TRIGGER_SNAPSHOT,
			
 
				+		Failure:     new_FailureCase_SIGTERM_ONE_FOLLOWER(clus),
			
 
				+	}
			
 
				+}
			
 
				+
			
 
				+func new_FailureCase_SIGTERM_LEADER_UNTIL_TRIGGER_SNAPSHOT(clus *Cluster) Failure {
			
 
				+	return &failureUntilSnapshot{
			
 
				+		failureCase: rpcpb.FailureCase_SIGTERM_LEADER_UNTIL_TRIGGER_SNAPSHOT,
			
 
				+		Failure:     new_FailureCase_SIGTERM_LEADER(clus),
			
 
				+	}
			
 
				+}