Thế lưỡng nan của người tù trong Lý thuyết trò chơi

Trước khi vào chủ đề chính, vòng vèo một tí. Lý thuyết trò chơi hiện có nhiều ứng dụng trong kinh tế, xã hội, nơi có các bên tham gia tranh đấu kiểu vừa hợp tác, vừa đấu tranh. Ở đó các bên không đơn giản là thuần tuý chạy theo lợi ích của mình thì mới đem kết quả tốt nhất. Nghĩ đến lợi ích cho người khác, thậm chí cho cả đối thủ sẽ giúp ta có nhiều lợi ích hơn. Ngạc nhiên chưa? 

Trong bộ phim “A Beautiful Mind (2001)” – [tên tiếng Việt: Một Tâm Hồn Đẹp] có nói về nhà toán – kinh tế học John Nash từng đoạt giải Nobel năm 1994, ông chính là một trong các nhân vật chủ chốt phát triển Lý thuyết trò chơi và giúp nó có tính ứng dụng cao trong cuộc sống. Tuy nhiên thì bộ phim không nói nhiều về Lý thuyết trò chơi mà chủ yếu kể về căn bệnh tâm thần phân liệt của ông cùng mối tình đẹp, đầy thử thách với vợ.

Trong phim chỉ cảm thấy có một câu liên quan nhất đến Lý thuyết trò chơi, khi John Nash tranh luận với một người bạn về câu nói của nhà kinh tế thế kỷ 18 – Adam Smith.

Adam Smith nói: Kết quả tốt nhất sẽ đến nếu mỗi cá nhân theo đuổi tối đa lợi ích cá nhân mình.

John Nash không nghĩ như vậy, ông bảo đúng nhưng chưa đủ! Ông sửa lại nó, đại ý thế này:

Để có kết quả tốt nhất, ngoài lợi ích cá nhân, người ta phải quan tâm đến lợi ích của nhóm mà mình nằm trong đó.

Quay lại chủ đề chính.

Thế lưỡng nan của người tù là bài toán nổi tiếng trong Lý thuyết trò chơi. Các chi tiết có khác đôi chút giữa các phiên bản, nhưng nội dung cơ bản giống như thế này:

Người A và B bị bắt, họ là đồng đảng, các bằng chứng chỉ đủ buộc tội họ 1 năm tù. Cảnh sát biết họ phạm các tội hình sự nghiêm trọng hơn nhưng lại không có bằng chứng rõ ràng.

Để A và B không thể thương thảo, họ được đưa vào hai phòng biệt lập và cảnh sát nói với họ như sau:

  • Nếu A thành khẩn thú nhận tội và B không nhận tội thì B sẽ bị phạt 10 năm tù, A được tha bổng. Ngược lại nếu B thú nhận tội, A không nhận tội thì B được tha bổng và A là 10 năm tù
  • Nếu cả hai đều thú tội, mỗi người 6 năm tù
  • Nếu cả hai không thú tội, các bằng chứng hiện tại chỉ đủ buộc tội họ mỗi người 1 năm tù

Vậy ta có bảng như sau, căn cứ vào các hành vi có thể của họ:

                       A – BNhận tộiKhông nhận tội
Nhận tội(6,6)(0,10)
Không nhận tội(10,0)(1,1)

Trường hợp lý tưởng nhất cho một cá nhân là họ được tha bổng, nhưng khi đó người kia sẽ bị phạt tới 10 năm tù.

Trường hợp dung hoà nhất là cả hai sẽ không nhận tội và mỗi bên chỉ bị có một năm tù thôi. Tổng cả hai người là 2 năm, nhẹ hơn so với tất cả các trường hợp còn lại (tổng là 10 và 12 năm tù).

Tuy nhiên thực tế, với những trường hợp như thế này, tù nhân A và B đều nhận tội và phản bội đồng đảng. Tại sao lại như vậy?

Tính toán cá nhân

Hãy xét tình huống này, vì hai tù nhân không thể biết được người kia thực sự quyết định điều gì do không thể truyền thông, họ phải ngồi đoán.

Tù nhân A nghĩ:

Nếu B nó khai thì cách tốt nhất là mình cũng khai ra, nếu mình không khai, mình sẽ bị phạt tới 10 năm tù. 

Nếu B nó không khai thì tốt nhất là mình cũng vẫn khai ra, bởi vì khi ấy mình sẽ được tha bổng.

Như vậy cách tốt nhất để phản ứng lại với bất kỳ lựa chọn nào của B là A sẽ khai ra.

Tất nhiên, ngược lại bản thân B cũng thấy vậy, cách tốt nhất để bảo vệ mình là khai ra, dù cho A có chọn lựa thế nào.

Điều này dẫn đến kết cục là vì không thể biết trước chắc chắn bên kia chọn lựa thế nào  nên cả hai sẽ khai ra, chống lại người kia để đảm bảo lợi ích cao nhất cho bản thân, mặc dù trên lý thuyết, cùng phủ nhận tội sẽ đem lại lợi ích hơn cho họ.

Tình thế trên còn cho chúng ta một kết luận lý thú: nếu hai bên có khả năng truyền thông đầy đủ cho nhau, thiệt hại sẽ giảm đi rất nhiều.

Ví dụ này rất giống trong các cuộc chạy đua vũ trang:

  • Nếu các bên đồng thuận, không chạy đua thì sẽ đỡ thiệt hại về kinh tế cũng như mức độ an toàn của các bên vẫn cao.
  • Nếu các bên đều chạy đua thì, mức độ an toàn không cao thêm nhưng thiệt hại kinh tế rất lớn.
  • Nếu một bên chạy đua, một bên không, thì bên không chạy đua gặp nguy cơ lớn về độ an toàn, an ninh quốc gia.

À quên, bộ phim đầu bài còn đoạn rất ấn tượng nói về việc cô sinh viên (vợ tương lai của John Nash) thoả thuận được với nhóm xây dựng bên ngoài, để họ làm việc ở chỗ khác, do vậy không gây tiếng ồn cho giờ học của cô đang diễn ra (mà lúc đó phải đóng cửa – rất nóng nực để giảm tiếng ồn).

Tôi là Nguyễn Đức Anh, sinh năm 1987. Hiện là marketing tự do. Theo dõi tôi trên Facebook để nhận thông tin cập nhật về blog này:

Trả lời

Thư điện tử của bạn sẽ không được hiển thị công khai.