Friday, February 11, 2011

Xác suất - Lý thuyết của sự Không Chắc chắn!

Trong lý thuyết xác suất, "xác suất = 100%" được gọi là "HẦU chắc chắn", tức có vẻ chắc chắn chứ cũng chưa chắc chắn, cho nên không có một khẳng định nào trong lý thuyết xác suất tương đương với các khẳng định bên logic học (cổ điển, chỉ có đúng/sai) cả.

- Xác suất ~ thiếu thông tin
- Có điều kiện ~ có thông tin -> có thể làm ảnh hưởng xác suất TƯƠNG ĐỐI -> với bài toán quyết định thì nên tận dụng điều kiện mọi lúc, vì chỉ dựa trên xs tương đối. Còn với bài toán đo đạc (tổng xs) thì tùy trường hợp, nếu ĐK có XS thì chỉ ảnh hưởng khi XS đó đủ cao (ko phải 1 lần và mãi mãi), còn nếu không có XS thì phải dựa vào số lần hữu hạn (có thể) xảy ra ĐK đó đối với chủ thể. Cơ sơ ủng hộ niềm tin "tận dụng điều kiện mọi lúc" là xs toàn phần của mọi sự kiện trong điều kiện đều được nhân cho xs của đk (nếu có), nên xs tương đối cao hơn thì vẫn "tốt hơn".
- Định lý Bayes: đưa các nút điều kiện lên gần gốc của cây trường hợp (phân hoạch kgian xs) như tái sắp xếp của OBDD
- nếu đã theo 1 ĐK, vd "nghe thầy bói" hoặc "ở VN", thì (thường là) đã bị ảnh hưởng bởi ĐK đó, nên các quyết định khác cũng nên theo ĐK đó.
- ĐK thường khó / không thể lập mô hình xác suất --> cần kiến giải uniinfo cho xs để liên kết tốt hơn giữa đk và xs.
- Khi thông tin có, nhưng thiếu, và không thể lập mô hình XS, thì có 2 trường hợp:
+ Mô hình xs đều (ko ảnh hưởng qđịnh) + logic tương đối (trên các số đo khác xs) --> quyết định dựa trên logic đó
+ Mô hình xs KHÔNG ĐỀU + logic tương đối --> cần phải có ngôn ngữ chung (uniinfo) để đưa ra quyết định từ 2 nguồn info đó (có thể trái ngược, như Prisoner Dilemma).

- Luật số lớn & nguyên lý giới hạn trung tâm
- Bất chấp phân bố nguồn, phân bố nhận là random (đều & độc lập với nguồn) thì kết quả là random!

- Kiểm định là không thể; Kiểm định giả thiết, nhiều giả thiết ngầm
- Ngẫu nhiên, điều không thể kiểm định.
- Phân bố gì cũng đều hiểu được theo phân bố đều; Nhưng cái quan trọng hơn của "ngẫu nhiên xác suất" là ĐỘC LẬP, và cái khó nhất, lại thường dùng nhất là TỰ ĐỘC LẬP! TỰ ĐL là không thể kiểm định ngay cả trên lý thuyết --> buộc phải dùng semantics "thế giới song song"
+ Quan điểm frequentist: Khi đo Pr(E(X)) bằng thống kê trung bình của các X liên tiếp, thì khi áp dụng cho chuỗi không liên tiếp có thể hoàn toàn thay đổi, nhứt là với những X "hiếm". VD: với 50:50 đỏ:đen thì Pr(10 đen)=1/1000, nên khi 1 người trong 1 chuỗi không liên tục nhận được toàn 10 đen thì chẳng ảnh hưởng gì đến người khác (mỗi người chỉ trích 1 tí xs cho anh ta). VD chuỗi: 01234567890123456..., 5938264017(my rand)98607(x2)3619205847(x3)...
- Thực nghiệm của XS là ThKê, nhưng phải có "số lớn", nên các trường hợp SỐ NHỎ đều chỉ là "niềm tin":
+ Thuần niềm tin: Tần suất vẫn tính được trong trường hợp số nhỏ / số nhỏ
+ Không chắc chắn, nhưng trong "các thế giới song song" thì xác suất cao --> vẫn là xác suất, vẫn không chắc chắn, nhưng ở các siêu thế giới thì xác suất lại cao nữa, v.v.


- Thứ tự bốc thăm (trong n người)
- Bốc thăm cùng lúc / tuần tự
- Bài toán đặt cọc & xác suất thắng của cái.

- Monty Hall paradox: các xác suất của host
+ chọn mở thêm cửa hay ko
+ chọn mở cửa có / ko có xe --> cửa chọn đầu có xs toàn phần 1 -> 1/3
+ chọn mở cửa 2 / 3 --> cửa đổi (2) có xs đk 1 -> 1/2
+ chọn cho đổi cửa hay ko
* Nếu host không làm theo xác suất (ngẫu nhiên) mà theo chiến lược (xác định nhưng không cố định, như đếm từ 1 đến vô cùng) thì không thể tính được xs.
+ Dụ: Thứ tự chọn có ảnh hưởng?

- Frequentist(objective) v. Bayesian(subjective): Setting prob v. guessing prob.
+ Frequentist: must make sure the objective setting is random with testing. keep from completely depends on the (SELF) INDEPENDENCY.
+ Bayesian: "random" = "no info" --> subjective, can make real random by subjectively randomly guess.
- Bên đặt và bên nhận, chỉ cần 1 bên random thì kết quả trở thành random --> hỗ trợ quan điểm chủ quan của Bayes.
- Prob, Value, or Logic? Bài toán "Đánh bạc có bảo hiểm"
+ Khi có nhiều lần, E(X) có hiệu quả
+ Khi có 1 lần, Pr(X) có hiệu quả
+ Khi có ít lần, dùng logic để xét các ràng buộc (decision problem).
- Bài toán "Đánh bạc có bảo hiểm": Xs thắng:thua là 1:2 (1 red 2 black), đặt cược 1 thì thắng:thua 2:1 (zero-sum, E(X)=0). Bảo hiểm đóng mỗi lượt 1 thì trả cho thua:thắng được 2:0.
+ 2 lượt chơi:
* XS át giá trị: 1rr:2rb:2br:4bb --> 44:44 (như 50:50) là thua2:thắng1 chứ không phải "không thua không thắng"
* Logic: BH 1; Cược 1 - ( thua được 0 - cược 1 - thắng được 1 | thua được 0 ) | ( thắng được 1 - cược 2 - thắng được 4 | thua được 0)
+ chơi thoải mái:
* Cố định giá trị thì "huề"
* Chiến lược luôn thắng (chu kì trung bình 3): cược 2, thua cược 3, thua cược 5, thua cược 8, ... (Fibonacci), thắng được gấp đôi, tức lời đúng phần đặt, cược lại 2, thắng cược 4, thắng cược 8 (đã được tổng 12 từ khi cược lại), ... (2exp), thua chỉ mất lần cuối!, cược lại 2, ... Tuy nhiên không thể tránh nguy cơ phá sản: n:Fib:Prob = 1:2:67%, 2:3:44%, 4:8:20%, 9:89:3%

Lý thuyết v. Thực tế
- Lý thuyết XS: Biến ngẫu nhiên (phần output), phân bố ngẫu nhiên. Hoàn toàn toán học, không liên quan gì đến khái niệm "ngẫu nhiên", mà chỉ là trường hợp đặc biệt của lý thuyết độ đo! Kết quả "định lý số lớn", "định lý giới hạn trung tâm"
- XS-TK: Biến cố ngẫu nhiên, thử nghiệm / phép thử ngẫu nhiên, quá trình ngẫu nhiên, không gian mẫu (input của biến ngẫu nhiên), sự ngẫu nhiên! Các quan điểm frequentist và Bayes.

- Penney's game: xs có điều kiện giấu trong Thứ Tự!
+ Dụ: 3 sự kiện cùng xảy ra hay trước sau? 000 (toàn 0) khó xảy ra hơn 100? So sánh bắc cầu (a>b>c)
- Cẩn thận với xs liên tục, vì "mọi card.omega đều có thể map cho nhau", nghịch lý Bertrand.

- Lão Andrey Kolmogorov thật ghê gớm: xác suất, hỗn loạn, thông tin thuật toán!