Thứ Hai, 31 tháng 12, 2012

PHÂN VÙNG VÀ ĐỊNH DẠNG Ổ ĐĨA

Partition (phân vùng): là một thuật ngữ phần mềm, nói đến một vùng không gian chứa dữ liệu xác định trên ổ đĩa cứng. 
Có 2 loại phân vùng là Primary - phân vùng khởi động, dùng để cài đặt hệ điều hành (OS), và Extended là phân vùng mở rộng, trong đó có thể chia nhỏ thành các phân vùng Logical để chứa dữ liệu riêng. Phân vùng Logical không có khả năng khởi động.
Cluster size: Coi phân vùng của bạn như một két bia được chia thành nhiều ô, mỗi tệp tin là một (hoặc một vài) chai bia, dù một hay một vài chai thì một ô cũng chỉ chứa 01 chai mà thôi. Vậy 1 ô đó chính là 1 cluster và cluster size chính là kích thước của ô đó. Kích thước càng lớn thì dung lượng bị lãng phí càng lớn, nhưng tốc độ truy xuất lại nhanh hơn nhiều.
Cluster size là thông số riêng của một phân vùng. Để tối ưu: đặt cluster size lớn nếu bạn có nhiều file và các file có dung lượng lớn; ngược lại, nếu bạn có nhiều file dung lượng nhỏ, hãy đặt cluster size nhỏ để dung lượng bị lãng phí ít nhất.
Sector: ( cung từ ) là đơn vị lưu trữ nhỏ nhất trên ổ cứng . Sector có 4 giá trị , dao động từ 512 Bytes cho đến 4096 Bytes . ( theo số mũ của cơ số 2 ) .
Chương trình khởi động Hệ Điều Hành ( chỉ là 1 đoạn mã ngắn , gọi là mã khởi động Boot Code ) được đặt ở 1 sector , gọi là Boot Sector . Mỗi phân vùng trên ổ cứng đều có 1 boot sector được đặt ở đầu phân vùng. Boot Code của mỗi phân vùng là khác nhau và do mỗi Hệ Điều Hành sử dụng phân vùng tự cài đặt . Boot Setor của Đĩa Mềm chính là sector đầu tiên , đĩa mềm không chia phân vùng được ( Cuối tháng 3/2011 , người ta ngưng sản xuất đĩa mềm , đúng là hơi buồn)
MBR ( Master Boot Record ) là sector đầu tiên của ổ cứng , không thuộc phân vùng nào cả , lại không phải là Boot Sector. Khi ta bật máy tính , BIOS của MainBoard sẽ thực hiện thao tác Kiểm tra thiết bị phần cứng , sau đó là tìm Đoạn Mã khởi động Hệ Điều Hành ( HĐH ) . Nếu ta chọn khởi động từ ổ cứng , BIOS sẽ tìm đến MBR trước để nạp tiếp chương tình khởi động cho máy. Tuy nhiên , MBR chưa thật sự nạp HĐH . Boot Code trong MBR sẽ xác định trong hiện tại : ổ cứng có chứa bao nhiêu Partition , có bao nhiêu HĐH , HĐH nào chiếm giữ phân vùng đó . Mỗi Phân vùng có 1 cờ hiệu ( Flag ) cho biết phân vùng có được ưu tiên kích hoạt ( Active ) khi khởi động hay không .Có nhiều kiểu cờ như Boot , lba , lvm ( Logical Volume Manager ) …
Ví Dụ: Đối với cờ Boot ( ưu tiên khởi động ) , nếu cắm cờ ở phân vùng nào thì khi khởi động , MBR sẽ nạp Boot Code của phân vùng đó để khởi động HĐH tương ứng của nó . Cờ Boot chỉ được kích hoạt ở 1 phân vùng duy nhất . Chỉ có Phân vùng Chính hoặc Phân vùng Mở Rộng mới Active được , phân vùng logic không có khả năng đánh dấu kích hoạt , tức là không Active được .


Muốn thay đổi Active từ phân vùng này sang phân vùng khác , ta phải sử dụng 1 chương trình trung gian . Đó có thể là fdisk , Partition Magic của DOS hay là Gparted của Linux . 
Ví Dụ : sử dụng Gparted , click chuột phải vào 1 phân vùng , chọn Manage Flags ( Đây là mục quản lý Cờ ) . Sau đó chọn cờ mà mình muốn .
Phân vùng Mở Rộng chính là 1 nhánh của phân vùng chính , nhưng có tính năng mở rộng . Với tính năng này , ta có thể tạo ra nhiều phân vùng con bên trong nó . Các phân vùng này được gọi là Phân vùng Logic .
1 ổ cứng chỉ chia được tối đa là 4 Phân vùng chính . Giới hạn này là do MBR của Ổ cứng chỉ chứa được 4 mục ( entry ) , cho phép ta lưu thông tin của 4 phân vùng đĩa . Tuy nhiên , nó có thể chứa vô số phân vùng Logic .
Phân vùng ổ đĩa
Thao tác phân vùng cho ổ đĩa có thể hiểu là phân chia lại các khoảng không lưu trữ trên đĩa cho phù hợp với mục đích sử dụng.
Phân vùng không phải là điều bắt buộc đối với các ổ đĩa cứng để nó làm việc (một vài hãng sản xuất máy tính cá nhân nguyên chiếc chỉ thiết đặt một phân vùng duy nhất khi cài sẵn các hệ điều hành vào máy tính khi bán ra), chúng chỉ giúp cho người sử dụng có thể cài đặt đồng thời nhiều hệ điều hành trên cùng một máy tính hoặc giúp việc quản lý các nội dung, lưu trữ, phân loại dữ liệu được thuận tiện và tối ưu hơn, tránh sự phân mảnh của các tập tin.
Ưu điểm
  • Tách hệ điều hành (OS) và dữ liệu các nhân của người sử dụng. Giúp quản lý, sao lưu,  phục hồi… với OS mà không ảnh hưởng tới dữ liệu. 
  • Sử dụng nhiều OS trên cùng một đĩa cứng.
  • Tạo khu vực riêng cho bộ nhớ ảo, tệp phân trang của OS.Quản lý các vùng dữ liệu độc lập. Một phân vùng lỗi sẽ không ảnh hưởng tới các phân vùng khác.Dễ quản lý dữ liệu riêng tư bằng các biện pháp cần thiết cho cả một phân vùng (vd: mã hóa).
  • Tăng tốc độ truy xuất dữ liệu trong một phần vùng: Về mặt phần cứng, đầu từ dễ dàng hoạt động liên tục hơn trong phạm vi hẹp. Về mặt phần mềm, truy xuất tập tin từ bảng quản lý tập tin (vd như $MFT của NTFS) càng nhỏ thì càng nhanh.
Nhược điểm :
  • Giảm dung lượng lưu trữ của HDD (tăng dung lượng - ngầm - cần để quản lý lưu trữ cho từng phân vùng)
  • Giảm năng lực lưu trữ thực của đĩa (vd: HDD bạn có 2 phân vùng, mỗi phân vùng còn trống 10GB, bạn không thể copy một file 15GB vào đâu mặc dù HDD của bạn thực sự còn trống đến 20GB).
  • Tăng khả năng phân mảnh dữ liệu > giảm tốc độ truy xuất chung, giảm khả năng cứu dữ liệu nếu lỗi phân vùng.
  • Chậm quá trình di chuyển tập tin trong đĩa ( nếu cùng phân vùng, Windows sẽ thực hiện sửa địa chỉ trên MFT - thao tác move coi như xong, nhưng nếu khác phân vùng Windows sẽ phải thực hiện việcmove khối dữ liệu thực sự)
  • Giảm tốc độ truy xuất dữ liệu trung bình toàn hệ thống: Các khu vực dữ liệu thường xuyên được truy xuất trên toàn bộ đĩa (theo thống kê của Windows) sẽ ko gom đc vào 1 vùng, giảm khả năng tối ưu đường đi của đầu đọc.
Vì vậy, nên chia ổ cứng thành vài phân vùng để quản lý nhưng đừng quá nhiều, trừ các phân vùng hệ điều hành thì các phân vùng dữ liệu: mỗi phân vùng nên để khoảng 20-25% dung lượng của toàn ổ đĩa cứng là tốt nhất.
Note
Phân vùng chứa hệ điều hành chính: thường nên thiết lập phân vùng chứa hệ điều hành tại các vùng chứa phía ngoài rìa của đĩa từ (outer zone) bởi vùng này có tốc độ đọc/ghi cao hơn, dẫn đến sự khởi động hệ điều hành và các phần mềm khởi động và làm việc được nhanh hơn. Phân vùng này thường được gán tên là C (đối với win).


Phân vùng chứa hệ điều hành không nên chứa các dữ liệu quan trọng bởi chúng dễ bị virus tấn công (hơn các phân vùng khác), việc sửa chữa khắc phục sự cố nếu không thận trọng có thể làm mất toàn bộ dữ liệu tại phân vùng này.


Phân vùng chứa dữ liệu thường xuyên truy cập hoặc thay đổi: những tập tin đa phương tiện (multimedia) nếu thường xuyên được truy cập hoặc các dữ liệu làm việc khác nên đặt tại phân vùng thứ hai ngay sau phân vùng chứa hệ điều hành. Sau khi quy hoạch, nên thường xuyên thực thi tác vụ chống phân mảnh tập tin trên phân vùng này.


Phân vùng chứa dữ liệu ít truy cập hoặc ít bị sửa đổi: nên đặt riêng một phân vùng chứa các dữ liệu ít truy cập hoặc bị thay đổi như các bộ cài đặt phần mềm. Phân vùng này nên đặt sau cùng, tương ứng với vị trí của nó ở gần khu vực tâm của đĩa (inner zone).
Các loại phân vùng, nguyên tắc phân vùng
- Có 5 loại phân vùng trong hệ thống máy X86: Primary; Extended; Logical; NTFS; Non-DOS.


Nguyên tắc:
  • Đối với Primary: là phân vùng đầu tiên và thường là duy nhất trên đĩa cứng để cài đặt điều hành, chỉ có Windows NT và các phiên bản sau của Linux thì có thể khởi động trên phân vùng Extended. Có tối đa 4 phân vùng Primary trên một ổ cứng hoặc 3 phân vùng Primary và 1 phân vùng Extended.
  • Đối với Extended: chỉ tồn tại khi có ít nhất một phân vùng Primary. Phân vùng này có thể chiếm một phần trống còn lại của đĩa hay chỉ chiếm một phần. Phần còn lại có thể chứa phân vùng NTFS hay Non-DOS.
  • Đối với Logical: trong phân vùng Extended phải có ít nhất 1 phân vùng Logical nếu bạn muốn DOS hay Windows truy cập đến đĩa cứng thông qua chữ cái đại diện. Nếu có phân vùng Extended mà không có phân vùng Logical trong nó thì bất cứ hệ điều hành nào cũng có thể thay đổi phân vùng Extended thành phân vùng Non-DOS.
  • Đối với NTFS: phân vùng NTFS thường được các phiên bản Windows sử dụng. Hệ điều hành Dos và Windows 8x, Me không có khả năng truy cập đến phân vùng này.
  • Đối với Non-DOS: phân vùng Non-DOS là phân vùng không được DOS hoặc Windows hỗ trợ.
Một số qui ước
Đối với Windows, Nó qui ước tên 1 phân vùng được gọi là 1 ổ đĩa , Kí hiệu là : B , C , … .Ví dụ : Windows thường đặt tên cho phân vùng cài đặt HĐH của nó là ổ đĩa C . Win chỉ cài được trên Phân vùng Chính ( Primary Partition ) và sử dụng duy nhất 1 phân vùng để cài đặt HĐH .


Đối với Linux, có thể cài được trên Primary Partition và Logical Partition . Linux cần 2 phân vùng để cài đặt HĐH :
1) Phân vùng gốc chứa hạt nhân và hệ thống File gọi là root partition ( Linux Native partition ). Linux sử dụng ký tự / để gán cho phân vùng gốc nơi Linux được cài đặt và lưu trữ file .
2) Phân vùng tạm , gọi là Swap partition dùng làm không gian trao đổi khi bộ nhớ vật lý ( như RAM ) bị đầy .
Hạt Nhân Linux chính là trái tim của HĐH , nó xem tất cả các loại đĩa và thiết bị đều ở dạng tập tin . Hệ thống File của Linux có rất nhiều thư mục , đứng đầu là thư mục gốc ( root directory )
Linux sử dụng lệnh mount để gán tên của 1 phân vùng vào tên của 1 thư mục bất kỳ . Đừng nhẫm lẫn với root directory của người dùng ( trong thư mục gốc có chứa 1 thư mục là root , đây là thư mục của tài khoản root )
Định dạng phân vùng
Lựa chọn định dạng các phân vùng là hành động tiếp sau khi quy hoạch phân vùng ổ đĩa cứng. Tuỳ thuộc vào các hệ điều hành sử dụng mà cần lựa chọn các kiểu định dạng sử dụng trên ổ đĩa cứng. 
Chọn kiểu định dạng nào cho phù hợp
Ba hệ thống tập tin (kiểu định dạng) phổ biến nhất hiện nay là NTFS (chuẩn của Windows), HFS+ (chuẩn OS X) và FAT32 (chuẩn cũ của Windows). Hiện nay, FAT32 rất phổ biến do được nhiều thiết bị và nhiều hệ điều hành hỗ trợ. Tuy nhiên, điểm hạn chế của FAT32 là giới hạn về dung lượng của từng file được lưu, và dung lượng của cả ổ đĩa. FAT32 được phát triển cách đây nhiều năm, dựa trên hệ thống tập tin FAT dùng cho DOS. Do ra đời đã lâu nên FAT32 chỉ hỗ trợ dung lượng file tối đa 4GB. Hiện tại, nếu bạn muốn lưu một bộ phim HD lên ổ cứng thì sử dụng FAT32 thực sự là một thách thức lớn.
Một số định dạng sử dụng trong các hệ điều hành họ Windows:
  • FAT(File Allocation Table): chuẩn hỗ trợ DOS và các hệ điều hành họ Windows 9X/Me (và các hệ điều hành sau). Phân vùng FAT hỗ trợ độ dài tên 11 ký tự (8 ký tự tên và 3 ký tự mở rộng) trong DOS hoặc 255 ký tự trong các hệ điều hành 32 bit như Windows 9X/Me. FAT có thể sử dụng 12 hoặc 16 bit, dung lượng tối đa một phân vùng FAT chỉ đến 2 GB dữ liệu.
  • FAT32(File Allocation Table, 32-bit): tương tự như FAT, nhưng nó được hỗ trợ bắt đầu từ hệ điều hành Windows 95 OSR2 và toàn bộ các hệ điều hành sau này. Dung lượng tối đa của một phân vùng FAT32 có thể lên tới 2 TB (2.048 GB). FAT32 thường được sử dụng cho ổ đĩa dung lượng thấp hơn 32GB. Tùy vào phần mềm sử dụng, bạn có thể tạo ra các ổ đĩa FAT32 lên đến vài TB.
  • NTFS(Windows New Tech File System): được hỗ trợ bắt đầu từ các hệ điều hành họ NT/2000/XP/Vista/Win7. Một phân vùng NTFS có thể có dung lượng tối đa đến 16 Exabytes.
Một số định dạng (hệ thống tập tin ) (file system) sử dụng trong họ linux:
Mỗi hệ điều hành lại hỗ trợ một chuẩn khác nhau. Chẳng hạn Windows 7 chỉ hỗ trợ NTFS và FAT32, không thể đọc được dữ liệu trên ổ đĩa được định dạng theo chuẩn HFS+. Ngược lại, Mac OS thì chỉ hỗ trợ HFS+, không hỗ trợ NTFS hay FAT32.
Hiểu được vấn đế trên nên các phiên bản Linux (cụ thể là Ubuntu) có thể hỗ trợ cả NTFS lẫn HFS+ để việc di chuyển dữ liệu từ hệ thống này sang hệ thống khác được dễ dàng hơn.
Khả năng hỗ trợ của file hệ thống Linux hoàn toàn khác biệt so với Windows Mac OS X. Cụ thể, trong Windows hoặc Mac OS X, chúng ta có thể dễ dàng tìm được các ứng dụng hỗ trợ file hệ thống non standard, nhưng cả 2 hệ điều hành trên lại chỉ được cài đặt dựa trên file system nguyên gốc. Nếu nói theo cách khác, Linux có khả năng hỗ trợ nhiều loại file hệ thống nhất hiện nay với công nghệ được tích hợp vào bên trong bộ kernel.
Journaling là gì?
Điểm trước tiên cần tìm hiểu ở đây chính là Journaling trước khi chúng ta nghiên cứu kỹ hơn về vấn đề này. Điều duy nhất các bạn cần nhớ về journaling là tất cả các loại file hệ thống ngày nay đều phải sử dụng journaling theo nhiều dạng khác nhau trên nền tảng laptop hoặc desktop với Linux.
Journaling chỉ được sử dụng khi ghi dữ liệu lên ổ cứng và đóng vai trò như những chiếc đục lỗ để ghi thông tin vào phân vùng. Đồng thời, nó cũng khắc phục vấn đề xảy ra khi ổ cứng gặp lỗi trong quá trình này, nếu không có journal thì hệ điều hành sẽ không thể biết được file dữ liệu có được ghi đầy đủ tới ổ cứng hay chưa.
Chúng ta có thể hiểu nôm na như sau: trước tiên file sẽ được ghi vào journal, đẩy vào bên trong lớp quản lý dữ liệu, sau đó journal sẽ ghi file đó vào phân vùng ổ cứng khi đã sẵn sàng. Và khi thành công, file sẽ được xóa bỏ khỏi journal, đẩy ngược ra bên ngoài và quá trình hoàn tất. Nếu xảy ra lỗi trong khi thực hiện thì file hệ thống có thể kiểm tra lại journal và tất cả các thao tác chưa được hoàn tất, đồng thời ghi nhớ lại đúng vị trí xảy ra lỗi đó.
Tuy nhiên, nhược điểm của việc sử dụng journaling là phải “đánh đổi” hiệu suất trong việc ghi dữ liệu với tính ổn định. Bên cạnh đó, còn có nhiều công đoạn khác để ghi dữ liệu vào ổ cứng nhưng với journal thì quá trình không thực sự là như vậy. Thay vào đó thì chỉ có file metadata, inode hoặc vị trí của file được ghi lại trước khi thực sự ghi vào ổ cứng.
Các tùy chọn file system:
Như đã đề cập tới ở bên trên, có khá nhiều dạng file hệ thống trong Linux, và mỗi loại sẽ được áp dụng với từng mục đích riêng biệt. Điều này không có nghĩa rằng những file hệ thống này không thể được áp dụng trong trường hợp khác, mà tùy theo nhu cầu và mục đích của người sử dụng, chúng ta sẽ đưa ra phương án phù hợp.
- Ext – Extended file system: là định dạng file hệ thống đầu tiên được thiết kế dành riêng cho Linux. Có tổng cộng 4 phiên bản và mỗi phiên bản lại có 1 tính năng nổi bật. Phiên bản đầu tiên của Ext là phần nâng cấp từ file hệ thống Minix được sử dụng tại thời điểm đó, nhưng lại không đáp ứng được nhiều tính năng phổ biến ngày nay. Và tại thời điểm này, chúng ta không nên sử dụng Ext vì có nhiều hạn chế, không còn được hỗ trợ trên nhiều distribution.
 - Ext2 thực chất không phải là file hệ thống journaling, được phát triển để kế thừa các thuộc tính của file hệ thống cũ, đồng thời hỗ trợ dung lượng ổ cứng lên tới 2 TB. Ext2 không sử dụng journal cho nên sẽ có ít dữ liệu được ghi vào ổ đĩa hơn. Do lượng yêu cầu viết và xóa dữ liệu khá thấp, cho nên rất phù hợp với những thiết bị lưu trữ bên ngoài như thẻ nhớ, ổ USB... Còn đối với những ổ SSD ngày nay đã được tăng tuổi thọ vòng đời cũng như khả năng hỗ trợ đa dạng hơn, và chúng hoàn toàn có thể không sử dụng file hệ thống không theo chuẩn journaling.
 - Ext3 về căn bản chỉ là Ext2 đi kèm với journaling. Mục đích chính của Ext3 là tương thích ngược với Ext2, và do vậy những ổ đĩa, phân vùng có thể dễ dàng được chuyển đổi giữa 2 chế độ mà không cần phải format như trước kia. Tuy nhiên, vấn đề vẫn còn tồn tại ở đây là những giới hạn của Ext2 vẫn còn nguyên trong Ext3, và ưu điểm của Ext3 là hoạt động nhanh, ổn định hơn rất nhiều. Không thực sự phù hợp để làm file hệ thống dành cho máy chủ bởi vì không hỗ trợ tính năng tạo disk snapshot và file được khôi phục sẽ rất khó để xóa bỏ sau này.
 - Ext4: cũng giống như Ext3, lưu giữ được những ưu điểm và tính tương thích ngược với phiên bản trước đó. Như vậy, chúng ta có thể dễ dàng kết hợp các phân vùng định dạng Ext2, Ext3 Ext4 trong cùng 1 ổ đĩa trong Ubuntu để tăng hiệu suất hoạt động. Trên thực tế, Ext4 có thể giảm bớt hiện tượng phân mảnh dữ liệu trong ổ cứng, hỗ trợ các file và phân vùng có dung lượng lớn... Thích hợp với ổ SSD so với Ext3, tốc độ hoạt động nhanh hơn so với 2 phiên bản Ext trước đó, cũng khá phù hợp để hoạt động trên server, nhưng lại không bằng Ext3.
 - BtrFS – thường phát âm là Butter hoặc Better FS, hiện tại vẫn đang trong giai đoạn phát triển bởi Oracle và có nhiều tính năng giống với ReiserFS. Đại diện cho B-Tree File System, hỗ trợ tính năng pool trên ổ cứng, tạo và lưu trữ snapshot, nén dữ liệu ở mức độ cao, chống phân mảnh dữ liệu nhanh chóng... được thiết kế riêng biệt dành cho các doanh nghiệp có quy mô lớn.
Mặc dù BtrFS không hoạt động ổn định trên 1 số nền tảng distro nhất định, nhưng cuối cùng thì nó vẫn là sự thay thế mặc định của Ext4 và cung cấp chế độ chuyển đổi định dạng nhanh chóng từ Ext3/4. Do vậy, BtrFS rất phù hợp để hoạt động với server dựa vào hiệu suất làm việc cao, khả năng tạo snapshot nhanh chóng cũng như hỗ trợ nhiều tính năng đa dạng khác.
Bên cạnh đó, Oracle cũng đang cố gắng phát triển 1 nền tảng công nghệ nhằm thay thế cho NFS CIFS gọi là CRFS với nhiều cải tiến đáng kể về mặt hiệu suất và tính năng hỗ trợ. Những cuộc kiểm tra trên thực tế đã chỉ ra BtrFS đứng sau Ext4 khi áp dụng với các thiết bị sử dụng bộ nhớ Flash như SSD, server database...
 - ReiserFS: có thể coi là 1 trong những bước tiến lớn nhất của file hệ thống Linux, lần đầu được công bố vào năm 2001 với nhiều tính năng mới mà file hệ thống Ext khó có thể đạt được. Nhưng đến năm 2004, ReiserFS đã được thay thế bởi Reiser4 với nhiều cải tiến hơn nữa. Tuy nhiên, quá trình nghiên cứu, phát triển của Reiser4 khá “chậm chạp” và vẫn không hỗ trợ đầy đủ hệ thống kernel của Linux. Đạt hiệu suất hoạt động rất cao đối với những file nhỏ như file log, phù hợp với database và server email.
 - XFS được phát triển bởi Silicon Graphics từ năm 1994 để hoạt động với hệ điều hành riêng biệt của họ, và sau đó chuyển sang Linux trong năm 2001. Khá tương đồng với Ext4 về một số mặt nào đó, chẳng hạn như hạn chế được tình trạng phân mảnh dữ liệu, không cho phép các snapshot tự động kết hợp với nhau, hỗ trợ nhiều file dung lượng lớn, có thể thay đổi kích thước file dữ liệu... nhưng không thể shrink – chia nhỏ phân vùng XFS. Với những đặc điểm như vậy thì XFS khá phù hợp với việc áp dụng vào mô hình server media vì khả năng truyền tải file video rất tốt. Tuy nhiên, nhiều phiên bản distributor yêu cầu phân vùng /boot riêng biệt, hiệu suất hoạt động với các file dung lượng nhỏ không bằng được khi so với các định dạng file hệ thống khác, do vậy sẽ không thể áp dụng với mô hình database, email và một vài loại server có nhiều file log. Nếu dùng với máy tính cá nhân, thì đây cũng không phải là sự lựa chọn tốt nên so sánh với Ext, vì hiệu suất hoạt động không khả thi, ngoài ra cũng không có gì nổi trội về hiệu năng, quản lý so với Ext3/4.
- JFS được IBM phát triển lần đầu tiên năm 1990, sau đó chuyển sang Linux. Điểm mạnh rất dễ nhận thấy của JFS là tiêu tốn ít tài nguyên hệ thống, đạt hiệu suất hoạt động tốt với nhiều file dung lượng lớn và nhỏ khác nhau. Các phân vùng JFS có thể thay đổi kích thước được nhưng lại không thể shrink như ReiserFS XFS, tuy nhiên nó lại có tốc độ kiểm tra ổ đĩa nhanh nhất so với các phiên bản Ext.
- ZFS hiện tại vẫn đang trong giai đoạn phát triển bởi Oracle với nhiều tính năng tương tự như Btrfs ReiserFS. Mới xuất hiện trong những năm gần đây vì có tin đồn rằng Apple sẽ dùng nó làm file hệ thống mặc định. Phụ thuộc vào thỏa thuận điều khoản sử dụng, Sun CDDL thì ZFS không tương thích với hệ thống nhân kernel của Linux, tuy nhiên vẫn hỗ trợ toàn bộ Linux’s Filesystem in Userspace – FUSE để có thể sử dụng được ZFS. Người sử dụng có thể gặp khó khăn khi cài đặt hệ điều hành Linux vì có yêu cầu FUSE và có thể không được hỗ trợ bởi distributor.
 - Swap có thể coi thực sự không phải là 1 dạng file hệ thống, bởi vì cơ chế hoạt động khá khác biệt, được sử dụng dưới 1 dạng bộ nhớ ảo và không có cấu trúc file hệ thống cụ thể. Không thể kết hợp và đọc dữ liệu được, nhưng lại chỉ có thể được dùng bởi kernel để ghi thay đổi vào ổ cứng. Thông thường, nó chỉ được sử dụng khi hệ thống thiếu hụt bộ nhớ RAM hoặc chuyển trạng thái của máy tính về chế độ Hibernate.
Trên đây là một số thông tin cơ bản về cấu trúc file hệ thống trong Linux, hy vọng rằng có thể giúp các bạn hiểu rõ hơn về hệ điều hành mã nguồn mở này cũng như kinh nghiệm lựa chọn file system sao cho phù hợp với nhu cầu, mục đích sử dụng. Chúc các bạn thành công!
(Nguồn: Quantrimang)
Format
Format là sự định dạng các vùng ghi dữ liệu của ổ đĩa cứng. Tuỳ theo từng yêu cầu mà có thể thực hiện sự định dạng này ở các thể loại cấp thấp hay sự định dạng thông thường.
+ Format cấp thấp
Format cấp thấp (low-level format) là sự định dạng lại các track, sector, cylinder (bao gồm cả các ‘khu vực” đã trình bày trong phần sector). Format cấp thấp thường được các hãng sản xuất thực hiện lần đầu tiên trước khi xuất xưởng các ổ đĩa cứng. Người sử dụng chỉ nên dùng các phần mềm của chính hãng sản xuất để format cấp thấp (cũng có các phần mềm của hãng khác nhưng có thể các phần mềm này không nhận biết đúng các thông số của ổ đĩa cứng khi tiến hành định dạng lại).


Khi các ổ cứng đã làm việc nhiều năm liên tục hoặc có các khối hư hỏng xuất hiện nhiều, điều này có hai khả năng: sự lão hoá tổng thể hoặc sự rơ rão của các phần cơ khí bên trong ổ đĩa cứng. Cả hai trường hợp này đều dẫn đến một sự không đáng tin cậy khi lưu trữ dữ liệu quan trọng trên nó, do đó việc định dạng cấp thấp có thể kéo dài thêm một chút thời gian làm việc của ổ đĩa cứng để lưu các dữ liệu không mấy quan trọng. Format cấp thấp giúp cho sự đọc/ghi trên các track đang bị lệch lạc trở thành phù hợp hơn khi các track đó được định dạng lại (có thể hiểu đơn giản rằng nếu đầu đọc/ghi bắt đầu làm việc dịch về một biên phía nào đó của track thì sau khi format cấp thấp các đầu đọc/ghi sẽ làm việc tại tâm của các track mới).


Không nên lạm dụng format cấp thấp nếu như ổ đĩa cứng của bạn đang hoạt động bình thường bởi sự định dạng lại này có thể mang lại sự rủi ro: do sự thao tác sai của người dùng, các vấn đề xử lý trong bo mạch của ổ đĩa cứng. Nếu như một ổ đĩa cứng xuất hiện một vài khối hư hỏng thì người sử dụng nên dùng các phần mềm che dấu nó bởi đó không chắc đã do sự hoạt động rơ rão của phần cứng.
+ Format thông thường


  • Định dạng mức cao (high-level format) là các hình thức format thông thường mà đa phần người sử dụng đã từng thực hiện (chúng chỉ được gọi tên như vậy để phân biệt với format cấp thấp) bởi các lệnh sẵn có trong các hệ điều hành (DOS hoặc Windows), hình thức format này có thể có hai dạng:
  • Format nhanh (quick): đơn thuần là xoá vị trí lưu trữ các ký tự đầu tiên để hệ điều hành hoặc các phần mềm có thể ghi đè dữ liệu mới lên các dữ liệu cũ. Nếu muốn format nhanh: sử dụng tham số “/q” với lệnh trong DOS hoặc chọn “quick format” trong hộp lựa chọn của lệnh ở hệ điều hành Windows.
  • Format thông thường: xoá bỏ các dữ liệu cũ và đồng thời kiểm tra phát hiện khối hư hỏng (bad block), đánh dấu chúng để chúng không còn được vô tình sử dụng đến trong các phiên làm việc sắp tới (nếu không có sự đánh dấu này, hệ điều hành sẽ ghi dữ liệu vào khối hư hỏng mà nó không báo lỗi - tuy nhiên khi đọc lại dữ liệu đã ghi đó mới là vấn đề nghiêm trọng).Đối với bộ nhớ Flash thì cũng không nên format nhiều dễ làm hỏng ổ đĩa.
+ Tham số khi format
  • Ở dạng format cấp thấp: các thông số thiết đặt phần nhiều do phần mềm của hãng sản xuất xác nhận khi bạn nhập vào các thông số nhìn thấy được trên ổ đĩa cứng (Model, serial number...) nên các thông số này cần tuyệt đối chính xác nhằm tránh sự thất bại khi tiến hành.
  • Ở dạng format thông thường: nếu là hình thức format nhanh (quick) thì các thông số được giữ nguyên như lần format gần nhất, còn lại có một thông số mà người tiến hành format cần cân nhắc lựa chọn là kích thước đơn vị (nhỏ nhất) của định dạng là cluster trong Windows XP (mục Allocation unit size trong hộp thoại lựa chọn format). Kích thước cluster có thể lựa chọn bắt đầu từ 512 byte bởi không thể nhỏ hơn kích thước chứa dữ liệu của một sector (với kích thước một sector thông dụng nhất là 512 byte). Các kích thước còn lại có thể là: 1024, 2048, 4096 với quy định giới hạn của từng loại định dạng (FAT/FAT32 hay NTFS).
Sự lựa chọn quan trọng nhất là phân vùng cần định dạng sử dụng chủ yếu để chứa các tập tin có kích thước như thế nào. Để hiểu hơn về lựa chọn, xin xem một ví dụ sau: Nếu lưu một tập tin text chỉ có dung lượng 1 byte (bạn hãy thử tạo một tập tin text và đánh 1 ký tự vào đó) thì trên ổ đĩa cứng sẽ phải dùng đến ít nhất 512 byte để chứa tập tin này với việc lựa chọn kích thước đơn vị là 512 byte, còn nếu lựa chọn cluster bằng 4096 byte thì kích thước lãng phí sẽ là 4096 - 1 = 4095 byte.


Nếu như lựa chọn kích thước cluster có kích thước khá nhỏ thì các bảng FAT hoặc các tập tin MFT (Master File Table) trong định dạng NTFS lại trở lên lớn hơn.


Như vậy ta nhận thấy: nếu ổ đĩa cứng sử dụng cho các tập tin do các phần mềm văn phòng thường ngày (Winword, bảng tính excel...), nên chọn kích thước nhỏ: 1024 hoặc 2048 byte. Nếu chứa các tập tin là dạng các bộ cài đặt phần mềm hoặc các tập tin video, nên chọn kích thước này lớn hơn. Đặc biệt ở các ổ cứng nhỏ dành cho thiết bị di động thì sự lựa chọn thường là 512 byte (đây cũng thường là lựa chọn khi format các loại thẻ nhớ). Windows có thể cho bạn biết một tập tin kích thước thực (size) của nó và kích thước chứa trên đĩa (size on disk) của nó bằng cách bấm chuột phải và chọn Properties. Điều này giúp bạn có thể nhận ra sự lãng phí đã nêu. Phần mềm Partition Magic của Symantec có thể so sánh việc lựa chọn kích thước các cluster trên một phân vùng tồn tại dữ liệu.
Phần mềm quy hoạch các phân vùng đĩa cứng
Có nhiều phần mềm có thể sử dụng để quy hoạch các phân vùng đĩa cứng: fdisk trong DOS, Disk Management của Windows (2000, XP, win7) và một số phần mềm của các hãng khác, nhưng có thể chúng chỉ đơn thuần là tạo ra các phân vùng, xoá các phân vùng mà không thay đổi kích thước phân vùng đang tồn tại, chúng thường làm mất dữ liệu trên phân vùng thao tác. 
Partition Magic (hiện tại của hãng Symantec) thường được nhiều người sử dụng bởi tính năng mạnh mẽ, giao diện thân thiện (sử dụng chuột, giống các phần mềm trong môi trường 32 bit) và đặc biệt là không làm mất dữ liệu khi thao tác với các phân vùng, tuy nhiên qua một thời gian dài không có bất cứ thay đổi nào khiến Norton PartitionMagic mất dần vị thế. Nhược điểm lớn nhất chính là dung lượng ổ đĩa mà phần mềm này hỗ trợ chỉ ở 300 GB trong khi đó thị trường đã phổ biến các ổ cứng dung lượng 2 – 2.5 TB với giá tiền không quá cao.
Công cụ định dạng ổ đĩa
Fat32format or GUIformat (Windows): Công cụ định dạng ổ đĩa FAT32 trong Windows, rất dễ sử dụng.
Disk Utility (Mac): Công cụ định dạng ổ đĩa theo chuẩn FAT32, có sẵn trên Mac OS.
GParted (Linux và LiveCD): Thường được sử dụng cho hệ thống Linux, và có trong các đĩa cứu hộ hệ thống. 



Nguồn: sưu tầm từ nhiều nguồn khác nhau. (để có kiến thức tổng quan về vấn đề này mìn đã chắp vá từ nhiều nguồn khác nhau, cuối cùng thì chiếc áo rách đã vá xong( mong bạn đọc và các tác giả thông cảm. bài viết chỉ mang tính cập nhập những thông tin mà mìn tích lũy được)

Không có nhận xét nào:

Đăng nhận xét