Thứ Hai, 20 tháng 1, 2014

Cơ bản về hệ điều hành

Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1)
- 5-
Có một lu ý nhỏ về chính khái niệm hệ điều hành trong thời kỳ đánh dấu sự phát triển
mạnh của HĐH truyền thống (vào khoảng những năm 1980). Trong nhiều tài liệu, đặc
biệt là tài liệu về thiết kế HĐH, "hệ điều hành" đợc hiểu theo những nội dung đã đợc
trình bày trên đây. Nhng trong không ít các tài liệu khác, "hệ điều hành" đợc hiểu
nh bộ các chơng trình hệ thống (xem hình 1.3) đợc cung cấp cho ngời sử dụng và
ngoài những thành tố đã nói - tơng ứng với thành phần điều kiển, HĐH còn có thành
phần ứng dụng và thành phần tiện ích. Lý do chính của việc mở rộng nội dung khái
niệm về HĐH nh vậy liên quan đến sản phẩm kết quả cung cấp cho ngời sử dụng là
một "bộ phần mềm hệ điều hành". Tuy nhiên, khi trình bày bản chất của HĐH, cách
quan niệm này cũng nhất quán với cách quan niệm đã nói và nội dung trong giáo trình
này nhất quán theo cách quan niệm nh vậy.

Tiếp theo trong mục dới đây, chúng ta mô tả sơ lợc quá trình tiến hóa của HĐH
truyền thống.
1.2.0. Tiến hóa hệ điều hành truyền thống

a. Hệ điều hành đơn chơng trình

HĐH đơn chơng trình (HĐH dãy: serial OS) xuất hiện đầu tiên: chơng trình của
ngời dùng đợc xếp hàng để lần lợt đợc đa vào bộ nhớ trong và chạy (thực hiện).
Một chơng trình sau khi đợc nạp từ dòng xếp hàng vào bộ nhớ trong đợc hệ thống
(cùng toàn bộ tài nguyên) phục vụ từ khi chơng trình bắt đầu chạy cho đến lúc
chơng trình kết thúc. Một chơng trình đợc nạp vào bộ nhớ nh vậy có thể đợc thực
hiện với nhiều bộ dữ liệu. Chỉ khi chơng trình này kết thúc thì mới nạp tiếp chơng
trình khác trong dòng đợi vào bộ nhớ trong. Trong hệ thống đơn chơng trình thực chất
không cần giải quyết bài toán điều khiển CPU (lập lich) vì CPU đã đợc dành riêng
cho chơng trình hiện tại.
Tuy nhiên, việc nạp chơng trình và dữ liệu vào bộ nhớ trong làm việc lại liên quan
đến thiết bị vào-ra đa dạng mà trong giai đoạn ban đầu phổ biến là vào bìa đục lỗ (thiết
bị vào chuẩn) và ra máy in (thiết bị ra chuẩn). Và tới một thời điểm, ra đời CPU tốc độ
cao, tốc độ nạp bìa cũng nh tốc độ in ra không theo kịp với tốc độ của CPU, vì thế
làm tăng thời gian nghỉ vô ích của CPU mà gây ra lãng phí. Đòi hỏi cần cải tiến nhằm
tăng hiệu quả hoạt động. Một trong những cải tiến đối với HĐH đơn chơng trình là
hoạt động theo chế độ SPOOLING (Simultaneous Peripheral Operation OnLine), mà
theo đó tất cả việc vào - ra đối với HĐH là làm việc với đĩa cứng còn vào - ra từ đĩa
phần cứng
chơng trình
hệ thống
Thiết bị vật lý
Vi chơng trình tại ROM
Ngôn ngữ máy
Hệ điều hành (Lời gọi hệ thống, nhân)
Trình biên dịch Trình soạn thảo Trình thông dịch
Các chơng trình ứng dụng
Hình 1.3. Một cách nhìn khác về kiến trúc mức hệ thống máy tính
Ngời dùng
Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1)
- 6-
cứng với các vật mang tin khác đợc đảm bảo bằng những cơ chế riêng. Tốc độ của
toàn bộ hệ thống đợc tăng lên đáng kể. Chế độ SPOOLING còn đợc sử dụng trong
những HĐH đa chơng trình xuất hiện sau này.
b. Hệ điều hành đa chơng trình

Sự tiến bộ nhanh chóng của công nghệ máy tính dẫn tới dung lợng bộ nhớ tăng lên
đáng kể (vợt xa dung lợng trung bình của các chơng trình ngời dùng) và tốc độ
CPU cũng tăng nhanh, chế độ hoạt động đa chơng trình xuất hiện. Chế độ đa chơng
trình (multiprogramming) đợc phân loại theo hớng độc lập ngời dùng (chế độ mẻ)
và hớng thân thiện ngời dùng (chế độ đa ngời dùng).
Đối với HĐH đa chơng trình, tại mỗi thời điểm có thể có nhiều chơng trình đồng
thời có mặt ở bộ nhớ trong. Các chơng trình này đều có nhu cầu đợc phân phối bộ
nhớ và CPU để thực hiện. Nh vậy, bộ nhớ, CPU, các thiết bị ngoại vi v.v. là các tài
nguyên của hệ thống đợc chia xẻ cho các chơng trình. Đặc điểm quan trọng cần lu
ý là các chơng trình này phải đợc bình đẳng khi giải quyết các yêu cầu tài nguyên.
Khái niệm chơng trình nói trong chế độ đa chơng trình đợc dùng để chỉ cả chơng
trình ngời dùng lẫn chơng trình HĐH.
Khi so sánh với HĐH đơn chơng trình, có thể nhận thấy ngay một điều là đối với một
chơng trình cụ thể thì trong chế độ đơn chơng trình, chơng trình đó sẽ kết thúc
nhanh hơn (thời gian chạy ngắn hơn) so với khi nó chạy trong chế độ đa chơng trình;
nhng bù lại, trong một khoảng thời gian xác định thì chế độ đa chơng trình sẽ hoàn
thiện đợc nhiều ch
ơng trình (giải đợc nhiều bài toán) hơn, do đó hiệu quả sử dụng
máy tính cao hơn.
Một trong những tài nguyên quan trọng nhất của hệ thống máy tính là CPU. Việc chia
xẻ CPU là một trong những dạng điển hình của việc chia xẻ tài nguyên. Tính chất chia
xẻ CPU lại phân lớp các HĐH đa chơng trình thành các lớp con: HĐH hoạt động theo
chế độ mẻ (batch) và HĐH hoạt động theo chế độ phân chia thời gian (time shared).

Hệ điều hành hoạt động theo chế độ mẻ
Đây là loại HĐH định hớng tới mục tiêu làm cực đại số lợng các bài toán đợc giải
quyết trong một khoảng đơn vị thời gian (có nghĩa là trong một khoảng đơn vị thời
gian thì hớng mục tiêu vào việc hoàn thiện đợc càng nhiều chơng trình càng tốt). ở
nớc ta những năm trớc đây, các máy tính EC-1022, EC-1035 (HĐH OS), IBM
360/40-50 (HĐH DOS) phổ biến hoạt động theo chế độ mẻ. Trong HĐH chế độ mẻ,
cách thức điều khiển CPU điển hình là một chơng trình ở trạng thái sẵn sàng sẽ đợc
chọn thực hiện (đợc phân phối CPU) khi chơng trình đang chạy phải ngừng vì nó
cần đến một tài nguyên khác CPU.
Các HĐH theo chế độ mẻ lại có thể phân biệt thành hai loại điển hình là MFT và
MVT: sự phân biệt chúng theo cách điều khiển bộ nhớ trong.
MFT: Multiprogramming with Fixed number of Tasks
Khi hệ thống làm việc, đã quy định sẵn một số lợng cố định các bài toán đồng thời ở
bộ nhớ trong: Bộ nhớ trong đợc chia thành một số vùng nhớ cố định, các vùng này có
biên cố định mà mỗi vùng đợc dùng để chứa một chơng trình tại một thời điểm. Mỗi
chơng trình ngời dùng chỉ đợc đa vào một vùng nhớ xác định tơng ứng với
chơng trình đó. Một chơng trình chỉ có thể làm việc trong giới hạn của vùng bộ nhớ
trong đang chứa nó: chơng trình đó tồn tại trong vùng bộ nhớ tơng ứng trong suốt
thời gian nó đợc thực hiện trong máy tính, kể từ lúc bắt đầu cho tới lúc kết thúc.

Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1)
- 7-
MVT: Multiprogramming with Variable number of Tasks
Khác với chế độ MFT, trong chế độ MVT, bộ nhớ trong không bị chia sẵn thành các
vùng, việc nạp chơng trình mới vào bộ nhớ trong còn đợc tiếp diễn khi mà bộ nhớ
trong còn đủ để chứa thêm chơng trình.
Có thể quan niệm rằng trong chế độ MFT bộ nhớ trong đợc phân thành các vùng có
vách ngăn cố định, còn trong chế độ MVT, không có vách ngăn sẵn, mỗi khi chơng
trình đợc nạp vào mới hình thành một vách ngăn tạm thời. Nếu chỉ gặp các chơng
trình đòi hỏi ít bộ nhớ thì theo chế độ MVT, số lợng chơng trình đồng thời có mặt
trong bộ nhớ nhiều lên.

Chế độ phân chia thời gian (Time Shared System: TSS)
Chế độ phân chia thời gian là chế độ hoạt động điển hình của các HĐH đa ngời dùng
(multi-users). HĐH hoạt động theo chế độ này định hớng phục vụ trực tiếp ngời
dùng khi chơng trình của ngời dùng đó đang thực hiện, làm cho giao tiếp của ngời
dùng với máy tính là hết sức thân thiện. Liên quan đến HĐH hoạt động theo chế độ
này là các khái niệm lợng tử thời gian, bộ nhớ ảo v.v.
Trong hệ TSS, tại cùng thời điểm có nhiều ngời dùng đồng thời làm việc với máy
tính: Mỗi ngời làm việc với máy tính thông qua một trạm cuối (terminal) và vì vậy, hệ
thống đã cho phép máy tính thân thiện với ngời dùng.
Khác với cách thức điều khiển CPU trong chế độ mẻ, HĐH phân phối CPU lần lợt
cho từng chơng trình ngời dùng, mỗi chơng trình đợc chiếm giữ CPU trong một
khoảng thời gian nh nhau (khoảng thời gian đó đợc gọi là lợng tử thời gian: time
quantum): có thể thấy phổ biến về lợng tử thời gian điển hình là khoảng 0,05s. Máy
tính làm việc với tốc độ cao, chu kỳ quay lại phục vụ cho từng chơng trình ngời
dùng là rất nhanh so với giác quan của ngời dùng, và vì vậy, mỗi ngời dùng đều có
cảm giác rằng mình đang chiếm hữu toàn bộ tài nguyên hệ thống.
Điều khiển bộ nhớ trong của chế độ đa ngời dùng có nhiều khác biệt bản chất so với
chế độ mẻ. Bộ nhớ trong luôn chứa chơng trình của mọi ngời dùng, vì vậy xảy ra
tình huống toàn bộ bộ nhớ trong không đủ để chứa tất cả chơng trình ngời dùng hiện
đang thực hiện; vì vậy, đối với HĐH TSS nảy sinh giải pháp sử dụng bộ nhớ ảo: sử
dụng đĩa từ nh vùng mở rộng không gian nhớ của bộ nhớ trong.
HĐH UNIX (và Linux) là HĐH đa ngời dùng điển hình.
Có thể nhận xét rằng, tính quản trị tài nguyên đợc nhấn mạnh trong HĐH mẻ và
tính
chất máy tính ảo đã đợc quan tâm hơn trong HĐH đa ngời dùng.
c. Hệ điều hành thời gian thực

Nhiều bài toán trong lĩnh vực điều khiển cần đợc giải quyết không muộn hơn một
thời điểm nhất định, và vì vậy, đối với các máy tính trong lĩnh vực đó cần HĐH thời
gian thực (RT: Real Time). Trong hệ thời gian thực, mỗi bài toán đợc gắn với một
thời điểm tới hạn (tiếng Anh là deadtime) và bài toán phải đợc giải quyết không
muộn hơn thời điểm đã cho đó: Nếu bài toán hoàn thiện muộn hơn thời điểm đó thì
việc giải quyết nó trở nên không còn ý nghĩa nữa. Hệ thời gian thực có thể đợc coi
nh một trờng hợp của hệ đa chơng trình hoạt động theo chế độ mẻ có gắn thêm thời
điểm kết thúc cho mỗi bài toán.
d. Hệ điều hành kết hợp

Các nhà thiết kế HĐH hiện đại cũng chọn lựa việc thiết kế HĐH có khả năng khởi tạo
hoạt động đợc theo một trong một số chế độ hoạt động của HĐH đã nói trên đây.
Chẳng hạn, HĐH OS cho hệ thống máy EC hoặc IBM có thể hoạt động hoặc theo chế
Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1)
- 8-
độ mẻ (MFT, MVT) hoặc theo chế độ phân chia thời gian (SYS); hoặc HĐH LINUX
hoạt động theo chế độ đơn ngời dùng (với superuser) hoặc chế độ đa ngời dùng (với
các ngời dùng khác). Kiểu hệ điều hành nh vậy đợc quan niệm là kết hợp nội dung
của nhiều loại hệ điều hành (Combination Operating System).
e. Hệ thống đa xử lý

Hệ thống nhiều CPU
Hiện nay, từ tốc độ phát triển nhanh của công nghệ, máy tính ngày càng đợc phổ
dụng trong xã hội. Mức độ thâm nhập của máy tính vào cuộc sống càng cao thì yêu
cầu nâng cao năng lực của máy tính lại ngày càng trở nên cấp thiết. Bộ nhớ chính ngày
càng rộng lớn; đĩa từ có dung lợng càng rộng, tốc độ truy nhập ngày càng cao; hệ
thống thiết bị ngoại vi càng phong phú, hình thức giao tiếp ngời-máy ngày càng đa
dạng. Nh đã nói, CPU là một tài nguyên thể hiện chủ yếu nhất năng lực của hệ thống
máy tính, vì vậy một trong những vấn đề trọng tâm nhất để tăng cờng năng lực của hệ
thống là tăng cờng năng lực của CPU. Đối với vấn đề này, nảy sinh các giải pháp theo
hai hớng:
Giải pháp tăng cờng năng lực của một CPU riêng cho từng máy tính: công nghệ vi
mạch ngày càng phát triển vì vậy năng lực của từng CPU cũng ngày nâng cao, các dự
án vi mạch VLSI với hàng triệu, hàng chục tiệu transitor đợc triển khai. Tuy nhiên
giải pháp này cũng nảy sinh những hạn chế về kỹ thuật: tốc độ truyền thông tin không
vợt qua tốc độ ánh sáng; khoảng cách gần nhất giữa hai thành phần không thể giảm
thiểu quá nhỏ v.v.
Song song với giải pháp tăng cờng năng lực từng CPU là giải pháp liên kết nhiều CPU
để tạo ra một hệ thống chung có năng lực đáng kể: việc xử lý song song tạo ra nhiều
lợi điểm. Thứ nhất, chia các phần nhỏ công việc cho mỗi CPU đảm nhận, năng suất
tăng không chỉ theo tỷ lệ thuận với một hệ số nhân mà còn cao hơn do không mất thời
gian phải thực hiện những công việc trung gian.
Thứ hai, giải pháp này còn có lợi điểm tích hợp các hệ thống máy đã có để tạo ra một
hệ thống mới với sức mạnh tăng gấp bội.
Chúng ta khảo sát một số nội dung chọn giải pháp đa xử lý theo nghĩa một hệ thống
tính toán đợc tổ hợp không chỉ một CPU mà nhiều CPU trong một máy tính (hệ đa xử
lý tập trung) hoặc nhiều máy tính trong một hệ thống thống nhất. Gọi chung các hệ có
nhiều CPU nh vậy là hệ đa xử lý.
Phân loại các hệ đa xử lý
Có một số cách phân loại các hệ đa xử lý:
Phân loại theo vị trí đặt các CPU: tập trung hoặc phân tán.
Các siêu máy tính (supercomputer) là các ví dụ về hệ đa xử lý tập trung. Đặc trng của
hệ thống này là các CPU đợc liên kết với nhau trong một máy tính duy nhất đảm bảo
độ kết dính phần cứng chặt. Ví dụ về hệ đa xử lý phân tán là các hệ thống tính toán
phân tán dựa trên mạng máy tính với độ kết dính phần cứng lỏng.
Phân loại theo đặc tính của các CPU thành phần: hệ đa xử lý thuần nhất hoặc hệ đa
xử lý không thuần nhất v.v. Một ví dụ quen thuộc về hệ không thuần nhất là thiết bị xử
lý trong máy vi tính gồm CPU xử lý chung và CPU xử lý dấu phảy động. Siêu máy tính
ILLIAC-IV gồm nhiều CPU có đặc trng giống nhau là một ví dụ về hệ thuần nhất.
Cách phân loại điển hình là dựa theo kiểu các CPU thành phần tiếp nhận và xử lý dữ
liệu trong một nhịp làm việc. Cách phân loại này bao gồm cả máy tính đơn xử lý thông
thờng:
Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1)
- 9-
- Đơn chỉ thị, đơn dữ liệu (SISD: Single Data Single Instruction) đợc thể hiện
trong máy tính thông thờng; Mỗi lần làm việc, CPU chỉ xử lý một dữ liệu và chỉ có
một chỉ thị (instruction, câu lệnh) đợc thực hiện. Đây là máy tính đơn xử lý.
- Đơn chỉ thị, đa dữ liệu (SIMD: Single Instruction Multiple Data):
Các bộ xử lý trong cùng một nhịp làm việc thực hiện chỉ cùng một chỉ thị. Ví dụ nh
phép cộng hai vector cho trớc: Các CPU thành phần đều thực hiện các phép cộng theo
đối số tơng ứng tại mỗi CPU; sau đó, chọn tiếp chỉ thị mới để tiếp tục công việc.
Thông thờng, hệ thống có bộ phận điều khiển riêng cho việc chọn chỉ thị và mọi CPU
thành phần cùng thực hiện chỉ thị đó (bộ xử lý ma trận).
- Đa chỉ thị, đơn dữ liệu (MISD: Multiple Instruction Single Data):
Trong các máy tính thuộc loại này, hệ thống gồm nhiều CPU, các CPU liên kết nhau
tuần tự: output của CPU này là input của CPU tiếp theo (Bộ xử lý vector). Các CPU kết
nối theo kiểu này đợc gọi là kết nối dây chuyền.
- Đa chỉ thị, đa câu lệnh (MIMD):
Mỗi CPU có bộ phân tích chơng trình riêng; chỉ thị và dữ liệu gắn với mỗi CPU: nhịp
hoạt động của các CPU này hoàn toàn độc lập nhau.
1.2.1. Cấu trúc hệ điều hành truyền thống
HĐH là bộ phần mềm lớn có kích thớc từ hàng nghìn tới hàng triệu dòng mã lệnh,
cho nên khi thi hành cần thiết phải kiến trúc phần mềm HĐH từ các môđun dễ dàng
quản lý (phù hợp với phơng pháp chung phát triển phần mềm). Kỳ vọng một kết quả
thiết kế là cung cấp các giao diện đợc xác định tờng minh giữa các môđun và cách
đặt các ràng buộc cho tơng tác môđun. Hai cách tiếp cận truyền thống thông dụng
phân hoạch các môđun là phân hoạch ngang và phân hoạch dọc. Phân hoạch dọc dựa
trên khái niệm mức, theo đó phân chia các môđun thành nhóm theo các mức khác nhau
với ràng buộc là chỉ cho phép tơng tác giữa các môđun thuộc hai mức liền kề. Đây là
giao diện một vào - một ra giữa các mức. Các môđun trong từng mức (phân hoạch
ngang) lại đợc tổ chức thành các thành phần lớn rời rạc nhau, mỗi thành phần nh thế
lại có thể đợc tinh chế tiếp theo tổ hợp phân hoạch ngang hoặc dọc (hình 1.4). Kiểu
điển hình của môđun là tập dòng lệnh thi hành một dịch vụ hệ thống riêng biệt. Trong
một hệ thống hớng đối tợng, các môđun cần đợc thi hành nh một đối tợng với
các thao tác (hoàn toàn xác định) trên mỗi đối tợng dịch vụ thành phần. Môđun hóa
dựa trên đối tợng là tốt hơn so với mã hóa. Mọi tài nguyên, bao gồm cả file và QT,
cần đợc tiếp cận nh đối tợng dữ liệu mà thể hiện vật lý của chúng phải đợc che
giấu bằng các cấu trúc dữ liệu trừu tợng. Hoạt động (thực hiện) của môđun đợc giới
Các ứng dụng
Kế toán Văn phòng Sản xuất
Các hệ thống
con
Môi trờng lập trình Hệ thống cơ sở dữ liệu
Các tiện ích
Bộ biên dịch Thông dịch lệnh Th viện
Các dịch vụ hệ
thống
Hệ thống File Quản lý bộ nhớ Bộ lập lịch
Nhân
CPU đa thành phần, kiểm soát ngắt, điều khiển thiết bị, đồng bộ
nguyên thủy, truyền thông liên quá trình
Hình 1.4 Phân mức các thành phần hệ điều hành theo chiều dọc và chiều ngang
Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1)
- 10-
hạn bằng một tập các thao tác và luật hình thức gán cho đối tợng. Môđun hớng đối
tợng cung cấp hàng loạt lợi thế, trong đó có tính đồng nhất truy nhập và bảo vệ. Vì
đồng nhất, chúng dễ dàng biến đổi và do đó làm tăng tính khả chuyển của hệ thống.
Tính khả chuyển của HĐH còn tăng lên khi tách các mã phụ thuộc-máy từ hệ thống.
Đa phần các phần mềm HĐH (các dịch vụ hệ thống) là độc lập phần cứng. Từ đó, hệ
thống cần đợc cấu trúc theo cách mà phần phụ thuộc-máy đợc giữ ở mức tối thiểu
nhất và tách rời khỏi các dịch vụ hệ thống. Cách tiếp cận nhân tối thiểu này làm giảm
bớt độ phức tạp về tính khả chuyển hệ thống từ kiểu kiến trúc máy tính này sang kiểu
kiến trúc máy tính khác vì chỉ có nhân mới phải viết lại. Các chức năng điển hình đợc
thi hành trong nhân tối thiểu bao gồm: tính đa thành phần của các bộ xử lý với hỗ trợ
đa chơng trình, kiểm soát ngắt, điều khiển thiết bị, (dịch vụ) nguyên thuỷ đồng bộ QT
(ĐBQT), các phơng tiện truyền thông liên QT (TTLQT, tiếng Anh Interprocess
Communication, IPC). Cấu trúc nhân thờng nguyên khối theo nghĩa không còn phân
hoạch ngang hoặc dọc đợc nữa mà chỉ là môđun hóa theo mã. Cấu trúc này đạt đợc
do nhân đã đợc tối thiểu nhất. Triết lý thiết kế này là hiệu quả cho phép chú ý tới cách
liên kết nhân hơn là cấu trúc nhân. Hình 1.4 thể hiện các khái niệm môđun hóa và cấu
trúc hóa với một số thành phần trong mỗi mức của phần mềm hệ thống.
Cấu trúc HĐH đợc nâng cao theo mô hình Client/Server. Mô hình Client/Server là
một mô hình lập trình khuôn mẫu. Theo mô hình này, lời gọi hệ thống từ các chơng
trình ứng dụng yêu cầu các dịch vụ HĐH giống nh yêu cầu QT khách trực tiếp tới QT
phục vụ. Chúng đợc thi hành gián tiếp thông qua nhân HĐH. Lời gọi hệ thống chia xẻ
một lối vào nhất quán tới hệ thống. Cơ chế này làm đơn giản hóa tơng tác tới HĐH và
cho phép ngời thiết kế hệ thống chuyển thêm nhiều dịch vụ hệ thống tới mức cao hơn
(trong nhiều trờng hợp tới không gian QT ngời dùng) và kết quả đợc nhân nhỏ hơn
và dễ quản lý hơn. Mô hình Client/Server là cách tự nhiên mô tả các tơng tác giữa các
QT trong hệ phân tán trong khi chuyển thông điệp (một khái niệm quan trọng) chỉ có
nghĩa chuyển vận dữ liệu trong các thực thể truyền thông.
Sự phân biệt giữa chơng trình ứng dụng với chơng trình hệ thống thờng mơ hồ.
Chơng trình trong nhân và dịch vụ hệ thống là phần mềm hệ thống (xem hình 1.4).
Tuy nhiên, theo một quan niệm khác (nh đã đợc trình bày trong hình 1.3), chơng
trình hệ thống còn bao gồm cả trình biên dịch, trình soạn thảo hệ thống, trình thông
dịch [3]. Chính bởi lý do đó mà ngời viết trình biên dịch cũng tự coi họ là những
ngời lập trình hệ thống. Tuy nhiên, trình biên dịch theo quan điểm của HĐH đợc
xem là một ứng dụng. Mặt khác, phần mềm cơ sở dữ liệu là một ứng dụng đối với trình
biên dịch hoặc một ngôn ngữ, đến lợt mình nó lại là chơng trình hệ thống đối với
Các ứng dụng
Mã máy 1 Mã máy Mã máy 2
API
Các dịch vụ hệ thống
SPI (hoặc HAL)
ứng dụng 1 ứng dụng 1 ứngdụng
Nền
Tính mở rộng
Tính dễ chuyển
Hình 1.5. Các mức API và SPI
Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1)
- 11-
ngời dùng. Kiến trúc này có thể phát triển thêm một vài mức. Ngời dùng nhìn hệ
thống qua một hệ thống con đợc đặc trng bằng các dịch vụ cung cấp cho họ. Mối
quan hệ giữa chơng trình hệ thống và chơng trình ứng dụng là gần gũi.
1.2.2. Hệ thống con và vi nhân
Nhân tối thiểu vạn năng mà dựa trên nó, các dịch vụ HĐH chuẩn đợc thi hành nhằm
hỗ trợ các hệ thống con hớng ứng dụng đợc gọi là vi nhân. Kiến trúc vi nhân bao
gồm một nhân tối thiểu phụ thuộc nền phần cứng và một tập các thi hành độc lập phần
cứng (dịch vụ hệ thống) bằng Bộ giao diện trình ứng dụng (API: Application Program
Interface) hoàn toàn xác định. Điều ý nghĩa của khái niệm vi nhân ở chỗ nó cung cấp
một môi trờng chứa các điều kiện cần và đủ để cấu trúc HĐH hoặc hệ thống con đáp
ứng nhu cầu bất kỳ với ít công sức nhất. Nhân, mặc dù phụ thuộc phần cứng, nhng
đợc cấu trúc với độ trừu tợng phần cứng để dễ dàng đợc ghi lại mã máy khi đợc
mang chuyển tới một nền khác. Cấu trúc bổ sung này đợc gọi là Mức trừu tợng phần
cứng (HAL: Hardware Abstraction Layer) hoặc Giao diện cung cấp dịch vụ (SPI:
Service Provider Interface) khi đợc sử dụng trong mô đun phần mềm mức trên. Nh
trình bày tại hình 1.5 thì API cung cấp tính mở rộng cho các ứng dụng mức cao còn
SPI (hoặc HAL) đề cao tính khả chuyển cho nền tảng mức thấp.
Các dịch vụ hệ thống là đồng hạng môđun và đầy đủ vì vậy chúng đợc dùng nh một
cơ chế để hỗ trợ lớp rộng lớn các ứng dụng. Ngời thiết kế phần mềm chỉ cần biết các
giao diện chuẩn tới các môđun dịch vụ thi hành và có thể chọn một tập con của chúng
theo đòi hỏi. Kiến trúc nh vậy rất thuyết phục vì tính môđun hóa, dễ mang chuyển và
khả năng tiếp thị (môđun thi hành có thể thuộc bản quyền của nhà cung cấp hệ thống
khác). Ngành công nghiệp đã có một vài cố gắng hớng tới một kiến trúc vi nhân
chung, đáng kể nhất là Microkernel của IBM và Windows NT của Microsoft.
Windows NT đợc trình bày trong hình 1.6 nh một ví dụ của kiến trúc vi nhân, trong
kiến trúc này mỗi khách thấy máy tính theo một môi trờng tính toán khác nhau (OS/2,
Win32, POSIX) đợc biểu diễn bởi API trong hệ thống con. Mỗi hệ thống con có
không gian địa chỉ lôgic riêng của mình, có thể đ
ợc cô lập và bảo vệ đối với các hệ
thống con khác. Lời gọi hệ thống con dựa trên API dịch vụ hệ thống và nh vậy đợc
thi hành một cách độc lập với việc thực hiện tại mức nhân và mức phần cứng. Nh một
Hệ thống con
POSIX
Hệ thống con
OS/2
Hệ thống con
Win 32
Khách POSIX
Khách OS/2
Khách Win
Nền phần cứng
API dịch vụ hệ thống
Quản lý Giám sát Quản lý Lời gọi Quản lý Quản lý
đối tợng an toàn quá trình thủ tục bộ nhớ ảo vào ra
cục bộ
Nhân với s
ự trừu tợng phần cứng
Mode
ngời
dùng
Mode nhân

Các
chấp
hành
Hình 1.6. Kiến trúc hệ thống Windows NT
Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1)
- 12-
chọn lựa, hệ thống con có thể tơng tác gián tiếp với dịch vụ hệ thống qua hệ thống
con Win32, hệ này hỗ trợ phơng tiện lập trình window. Kiến trúc tại hình vẽ đạt đợc
mọi khái niệm kiến trúc hệ thống nh đã thảo luận: môđun hóa, phân mức, mô hình
Client/Server, mô hình đối tợng, và nhân tối thiểu. Hầu hết các HĐH hện đại theo
đuổi triết lý thiết kế nh vậy với một vài khác biệt nhỏ khi thi hành.
1.2.3. Các chức năng quản trị

HĐH có chức năng quản trị tài nguyên. Mỗi tài nguyên trong hệ thống máy tính nói
chung thuộc vào một trong bốn lớp: Bộ xử lý/quá trình, bộ nhớ, I/O và dữ liệu/file. Mô
tả một cách tóm tắt các vấn đề cơ sở của HĐH truyền thống. Tóm tắt này nh là những
thông tin nền tảng cho thảo luận HĐH mạng, HĐH phân tán và hệ tự trị cộng tác.
Quản trị Bộ xử lý/Quá trình
ở mức hệ thống thấp nhất là cung cấp ánh xạ (lập lịch:
scheduling) các bộ xử lý tới các QT, hoặc ngợc lại. Để thuận tiện cho việc mở rộng đa
ngời dùng và đa bài toán (đa nhiệm), cần tới tính đa thành phần-không gian bộ nhớ
(nơi đặt QT) và tính đa thành phần-thời gian các bộ xử lý (nơi QT thực hiện). Thi hành
tính đa thành phần nh vậy thông qua tính đa chơng trình và phân chia thời gian đợc
cơ chế kiểm soát ngắt đầy đủ hỗ trợ. Tại mức cao, việc thi hành là trong suốt tới các
QT thực hiện đồng thời. Ngời dùng chỉ quan tâm tới việc phối hợp tơng tác các QT
đồng thời. Các tơng tác đòi hỏi ĐBQT và TTLQT. Trong hơn hai chục năm trở lại
đây, hàng loạt phơng pháp ĐBQT đợc đề xuất nhằm giải quyết bài toán đồng bộ nhờ
loại trừ ràng buộc và kết hợp trạng thái.
Hầu hết các tiếp cận cơ sở dùng lời gọi hệ thống đặc biệt thao tác trên các biến kiểu dữ
liệu semaphore. Do đợc hệ thống hỗ trợ khả năng kết khối QT, các thao tác nguyên tử
trên semaphore (yêu cầu tài nguyên P(s) / giải phóng tài nguyên V(s)) cho phép phối
hợp các QT tơng tác. Các tiếp cận khác (không dùng semaphore) gắn năng lực đồng
bộ vào ngôn ngữ lập trình nhờ hoặc là biến dạng cấu trúc điều khiển (chẳng hạn,
khoảng tới hạn có điều kiện - Condition Critical Region, ghi tắt CCR. Khái niệm cơ sở
là khoảng tới hạn - Critical Region, ghi tắt là CR) hoặc là bổ sung kiểu dữ liệu trừu
tợng mới (chẳng hạn, bộ giám sát - monitor). Ngoài ra, một cách thức ĐBQT khác
dựa theo cách lệnh vào-ra, chẳng hạn Bộ các quá trình tuần tự truyền thông
(Communicating Sequential Processes: CSP). Đây là cách tiếp cận tổng quát hơn theo
kiểu lời gọi thủ tục và dẫn dắt điểm hẹn (rendezvous) trong ngôn ngữ lập trình Ada.
Tiến thêm một bớc mới, cho phép đặc tả dãy các điều khiển thực hiện đồng thời trong
một chơng trình mà không cần dùng các nguyên thủy đồng bộ một cách tờng minh,
nh đợc thi hành trong biểu thức đờng đi (Path Expression: PE). Ngời ta chỉ ra
rằng, mọi tiếp cận đợc đề xuất cho bài toán đồng bộ có thể đợc thi hành với sự thỏa
hiệp giữa hiệu quả và năng lực diễn tả lời giải bài toán. Các ph
ơng pháp đồng bộ
truyền thống sẽ đợc mô tả sơ lợc tại chơng 3).
Các phơng tiện TTLQT đợc phát triển song hành với ĐBQT. Trong HĐH tập trung,
TTLQT xuyên qua chia xẻ bộ nhớ
dờng nh là giải pháp dễ dàng. Tuy nhiên, chia xẻ
bộ nhớ vi phạm giả thiết cơ bản là các QT không đồng bộ và nhìn chung là không chia
xẻ không gian địa chỉ chung. Lựa chọn còn lại là truyền thông
thông qua chuyển thông
điệp (ghi tắt CTĐ, message passing). u điểm của CTĐ do nó là một phần bản chất
của hệ phân tán và nh vậy có thể đa việc phát triển HĐH tập trung thích hợp với việc
phát triển hệ phân tán.
Điều rất có giá trị chính là mối quan hệ thân thiết giữa ĐBQT và truyền thông QT
(TTQT). TTQT đòi hỏi một số giả thiết nền tảng từ ĐBQT, chẳng hạn nh đồng bộ gửi
và nhận dữ liệu. Với các dịch vụ nguyên thủy của truyền thông QT, cấu trúc đồng bộ
mức cao có thể đợc thi hành chỉ dựa trên các TTQT nguyên thủy. Khởi đầu từ nguyên
Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1)
- 13-
thủy đồng bộ và truyền thông cũng dẫn đến việc phát triển ngôn ngữ đồng thời: các
ngôn ngữ cho phép đặc tả đợc QT đồng thời, đồng bộ và TTLQT. Ngôn ngữ đồng thời
và đồng bộ/truyền thông trong hệ phân tán đợc bàn luận tơng ứng trong chơng 3 và
chơng 4.
Cùng với ĐBQT và TTQT, quản trị QT còn có chức năng lập lịch. Quá trình đang sẵn
sàng (ready) hoặc ở dòng xếp hàng (waiting sequence) cần đợc lập lịch lại để thực
hiện khi tài nguyên đã sẵn sàng hoặc điều kiện nào đó đợc thỏa mãn. Rất nhiều chiến
lợc đợc dùng nhằm đạt đợc hàm mục tiêu, chẳng hạn tối thiểu thời gian chuyển lịch
hoặc tối đa thông lợng hệ thống (system throughput). Lập lịch bài toán (task, hoặc
quá trình - process) cho máy đơn-đa xử lý là một vấn đề nghiên cứu thao tác cổ điển.
ứng dụng lập lịch bài toán vào hệ phân tán là phức tạp do tồn tại đa máy tính và tổng
phí (overhead) truyền thông buộc phải tính đến trong lập lịch. Tồn tại hai kiểu lập lịch:
Lập lịch QT tĩnh dựa trên mô hình quan hệ đi trớc và chia xẻ tải động quá trình dựa
trên mô hình quan hệ phụ thuộc quá trình. Quan hệ đi trớc biểu diễn các QT buộc
phải đồng bộ nh thế nào, trong khi đó quan hệ phụ thuộc chỉ cho biết dấu hiệu tơng
tác giữa các QT. Hai kiểu lập lịch này biểu diễn độ hiểu biết khác nhau về mối tơng
tác giữa các QT trong đồng bộ và truyền thông. Lập lịch tĩnh, chia xẻ động và cân
bằng tải đợc trình bày trong chơng 5.
Quản trị thiết bị vào - ra
là trách nhiệm chặt chẽ của hệ thống các thiết bị gắn kết vật
lý. Nhằm giảm bớt độ phức tạp khi thiết kế hệ thống theo tính phụ thuộc máy, kiến
trúc hệ thống của bộ xử lý thờng đợc tách hoàn toàn khỏi tính chi tiết thiết bị vào-ra.
Bộ xử lý cung cấp một giao diện chung tới tất cả thiết bị và căn cứ theo giao diện
chung đó, nhà chế tạo thiết bị vào-ra phát triển thiết bi điều khiển thiết bị vào-ra và
trình điều khiển phần mềm để tích hợp vào hệ thống. Theo hớng trừu tợng, các thiết
bị vào-ra chỉ là bộ ghi nhớ: Một số cho phép đọc và ghi (chẳng hạn, đĩa từ), một số
khác chỉ cho phép đọc (chẳng hạn, bàn phím) và một số khác nữa chỉ cho phép ghi
(chẳng hạn, máy in). Theo quan điểm của HĐH, thích hợp nhất coi tất cả thiết bị vào-
ra là file lôgic. File lôgic biểu diễn thiết bị vật lý đợc gọi là thiết bị ảo. Các QT chỉ
thao tác trên các file và hệ thống chịu trách nhiệm diễn giải file này tới thiết bị vật lý.
Ngời ta sử dụng một số kỹ thuật nhằm tăng tốc thao tác vào-ra, đáng kể nhất là hai
khái niệm spooling và buffering. Spooling (nh đã đợc giới thiệu tại trang 10) làm
thuận tiện chia xẻ các thiết bị vào - ra, còn buffer (bộ đệm) căn bản đợc dùng để dàn
xếp sự khác nhau về tốc độ làm việc giữa thiết bị vào-ra chậm và bộ xử lý nhanh.
Buffer có thể đợc thi hành ở nhiều mức phần mềm khác nhau, chẳng hạn nh hệ
thống file, trình điều khiển thiết bị, và trong một số trờng hợp ở ngay trong thiết bị
điều khiển vào-ra. Hai thiết bị vào - ra quan trọng nhất là ổ đĩa và trạm cuối. Đĩa tốc độ
cao và dung lợng rộng (vài trăm gigabytes) là rất thông dụng. Đĩa dung lợng cao
đóng vai trò đáng kể trong việc thiết kế phần mềm lớn. Trạm cuối bản đồ - bộ nhớ tạo
nên sự thi hành việc hỗ trợ các cửa sổ (windows) tại trạm cuối. Cửa sổ đợc khởi hành
nh một bàn giao tiếp ảo (virtual console) đơn giản. Với các chức năng bổ sung nh
một giao diện ngời dùng đồ họa và các cửa sổ đa tơng tác, windows đợc tiến hóa
thành giao diện đang phát triển một cách thăng hoa đối với hệ thống con và sẽ trở
thành một máy tính ảo nh trờng hợp HĐH Windows 95.
Một vấn đề đáng quan tâm liên quan tới quản trị vào-ra là bế tắc (deadlock). Bế tắc nảy
sinh trong hệ thống do định vị sai tài nguyên khi có một tập QT không
u tiên
(nonpreemptable) mà mỗi từ chúng giữ tài nguyên lại đòi hỏi tài nguyên từ QT trong
tập đó, tạo ra một chu trình xâu QT không thể tháo rời. "Tài nguyên" có thể là thiết bị
vật lý và (chung hơn) là các buffer và các điều kiện. Việc phòng ngừa, thoát ra, và phát
Hà Quang Thụy Bài giảng Hệ điều hành phân tán (Phần 1)
- 14-
hiện bế tắc đã đợc nghiên cứu rộng rãi. Tuy nhiên, phát hiện và giải quyết bế tắc phân
tán hiện vẫn đang là vấn đề mở.
Quản lý bộ nhớ
bao gồm việc phân phối - phân phối lại bộ nhớ và ánh xạ không gian
chơng trình lôgic vào bộ nhớ vật lý. Mục tiêu căn bản là bảo đảm tận dụng cao bộ
nhớ và cung cấp bộ nhớ ảo hỗ trợ chơng trình lớn, đặc biệt là các chơng trình có
kích thớc vợt kích thớc bộ nhớ vật lý. Hầu hết hệ thống máy tính hiện nay đều sử
dụng các kỹ thuật điều khiển trang (paging)/ điều khiển segment (segmentation) khi
thi hành bộ nhớ ảo. Thi hành bộ nhớ ảo đòi hỏi phần cứng bổ sung, thờng đợc gọi là
đơn vị quản lý bộ nhớ (memory managment unit). Cả trang và segment đều là các cơ
chế phân phối bộ nhớ rời rạc. Sự khác nhau chính giữa hai cơ chế này phân chơng
trình theo trang vật lý và theo segment logic. HĐH hiện đại thi hành bộ nhớ ảo theo cơ
chế tổ hợp hai cơ chế này. Do không phải tất cả các trang và segment đồng thời nằm
trong bộ nhớ trong, nên cần điều tiết những chỉ dẫn tới dữ liệu và chỉ thị (lệnh) mới khi
thực hiện một chơng trình. Nhiều thuật toán thay trang đợc đề xuất nhằm rút gọn tần
số lỗi trang. Hiệu suất của chiến lợc thay trang phụ thuộc mạnh vào cách thực hiện
chơng trình tại khoảng thời gian đã cho bất kỳ. Định hớng không gian và thời gian
đợc mô tả tổng quát trong chơng trình có ảnh hởng đáng kể khi chọn thuật toán
thay trang.
Bộ nhớ ảo là giải pháp nhằm giải quyết sự khác nhau về kích thớc và tốc độ giữa bộ
nhớ đĩa chậm tơng đối và bộ nhớ vật lý nhanh hơn. Tồn tại vấn đề tơng tự khi bộ
nhớ tốc độ cao (cache) đợc dùng nh bộ đệm giữa bộ xử lý và bộ nhớ chính. Quá
trình buffer này chỉ đòi hỏi phải ánh xạ địa chỉ vật lý (đợc gọi là caching) mà thông
thờng đợc quan tâm theo hớng kiến trúc hơn là vấn đề của HĐH. Chọn lựa thuật
toán thay trang, ảnh hởng của cỡ trang và segment, ảnh hởng của phân phối bộ nhớ,
caching và liên kết cache là một số vấn đề của quản trị bộ nhớ.
Trong HĐH tập trung, bộ nhớ chia xẻ cho giá trị là tính đơn giản đối với truyền thông
và tơng tác QT. Nhiều thuật toán đợc phát triển cho bộ nhớ chia xẻ. Trong môi
trờng phân tán, hy vọng mô phỏng đợc hệ thống bộ nhớ chia xẻ trong khi không có
bộ nhớ vật lý chia xẻ. Khái niệm bộ nhớ phân tán này đa ra một số câu hỏi về tính
nhất quán và hiệu năng của chia xẻ dữ liệu là tơng tự nh chia xẻ file trong hệ thống
file phân tán. Chơng 6 trình bày về hệ thống file phân tán.
Cuối cùng, song không kém quan trọng, là quản trị file
trong HĐH. File là một thực
thể dữ liệu lôgic đợc thi hành trên các thiết bị nhớ, bao gồm đĩa, bộ nhớ, và thậm chí
cả thiết bị vào-ra. Theo nghĩa trừu tợng nhất, mọi tính toán đợc xem nh các quá
trình thao tác với file. Nếu bỏ đi hai thuật ngữ cơ bản là quá trình và file, thì không còn
có gì nghiên cứu về HĐH. Do chúng ta chỉ giải quyết với quá trình và file, mọi chủ đề
tiếp theo đều liên quan đến chúng. Chúng ta không bàn luận nhiều về quản trị vào - ra
và quản trị bộ nhớ vì điều đó chỉ thích hợp trong HĐH tập trung.
File cần đợc cấu trúc và thi hành trớc khi đợc thao tác. Mỗi khi một cấu trúc file
chung và thi hành của chúng đợc quyết định thì các chức năng cơ sở để quản trị file là
truy nhập file (file acces) và chia xẻ file. Thêm nữa vì mục tiêu hiệu quả, truy nhập file
đòi hỏi cơ chế điều khiển bảo vệ (protection) và an toàn, và chia xẻ file đồng bộ hoặc
điều khiển đồng thời. Khác với quản trị bộ nhớ và quản trị vào-ra, file đợc phân tán và
nhân bản trên mạng hoặc môi trờng phân tán. An toàn và điều khiển đồng thời file để
thao tác file trở thành những vấn đề thiết thực hơn trong thiết kế HĐH phân tán so với
HĐH tập trung. ứng dụng caching trong truy nhập file cũng phức tạp hơn, do thực tế
file đợc cache trên nhiều máy. Một số chơng, đoạn tiếp thảo luận về thi hành và điều
khiển hệ thống file phân tán.

Không có nhận xét nào:

Đăng nhận xét