Hot Spindles
Xin lỗi không có trong cả hai sự hiện diện và các bài viết. Nó là một roller-coaster năm qua với thương tích cá nhân và lịch trình làm việc phẳng, vì vậy tôi có ít thời gian hoặc động lực để viết blog hay hiển thị mặt của tôi xung quanh các cộng đồng. Lời xin lỗi của tôi, và tôi xác định để phá vỡ thói quen này và nhận được trở lại một lần nữa! Nhưng đủ của trò chuyện, với các văn bản ...
Đây không phải là một cái gì đó tôi thấy rất thường xuyên, nhưng khi tôi làm, đó là thú vị để xem các số liệu thống kê nói cho mình. Tôi với một khách hàng đã có một triển khai kịch bản của bất động sản NetApp của họ một vài năm trước đây, và nó không được thiết kế hoặc chuyển giao với chăm sóc quá nhiều hoặc sự chú ý (cái gì tôi muốn thảo luận về một ngày khác). Họ có một bất động sản VMware với SQL, Exchange và những thứ khác. Tất cả đều chạy trên tổng số hơn 100 15k FC cọc. Nó không phải là một bất động sản rất lớn so với các trang web khác, vì vậy tôi tò mò vào lý do tại sao họ có vấn đề hiệu suất như vậy.
Bây giờ khi bạn chạy qua "sysstat-u", bạn có thể thấy rằng các filer chính nó được làm rất ít, hoàn toàn hạnh phúc với những gì nó phải làm. Tuy nhiên, các đĩa được đánh 100% khá thường xuyên. Ngay lập tức này cho thấy một vấn đề đĩa. Họ cần nhiều cọc, rõ ràng?
Thứ nhất đó là sự mất cân bằng của cọc. Họ có một tập hợp thứ hai trên bộ điều khiển đối tác chỉ có khối lượng kiểm tra. Tôi nhận được sự cho phép loại bỏ điều này và nóng, tôi lại phân bổ các bộ điều khiển khác và mở rộng tổng hợp hiện có. Điều này tăng gấp đôi số lượng trục, nhưng tôi biết nó sẽ không làm bất cứ điều gì cho hiệu năng hiện có (mà dữ liệu sẽ tự động phân phối lại bản thân).
Nếu tôi chạy qua "số liệu thống kê chương trình đĩa: *: disk_busy" Tôi có thể nhìn thấy một cái gì đó khá rõ ràng. Có một đĩa duy nhất trong toàn bộ hệ thống được đánh 100%, còn lại là không. Có một loạt các đĩa khác (khoảng 10), đang chạy 50-60%, và sau đó các đĩa còn lại đánh dấu vào khoảng 20-30% Vì vậy, những gì đã xảy ra ở đây? NetApp công nghệ sẽ ngăn chặn bất kỳ hình thức trục chính nóng trong hệ thống.
Lý thuyết của tôi. Filer được rót và xếp chồng lên nhau ra khỏi hộp, tổng hợp không phát triển (3 đĩa tổng hợp, 1 dữ liệu, 2 chẵn lẻ). Lưu trữ một số được cung cấp và dữ liệu di cư. Họ chạy ra khỏi không gian, do đó, tăng trưởng tổng hợp (một ít), sau đó sao chép dữ liệu lên đĩa một bó hơn. Sau khi tất cả những điều này, họ sau đó được thêm vào các phần còn lại của đĩa. Bây giờ, vì dữ liệu sẽ tự động tái phân bổ trên bay, bất kỳ dữ liệu vẫn không thay đổi (như sẽ xảy ra với đĩa hệ thống máy ảo, email Exchange, và các dữ liệu Kho dữ liệu cũ), sau đó họ vẫn còn ngồi trên cọc ban đầu hoặc thậm chí trục chính như khi họ lần đầu tiên được cài đặt.
Vì vậy, tôi mong đến cuối tuần. Chúng tôi sẽ được nâng cấp dữ liệu ONTAP 7.3.2 và sau đó có thể chạy một số phân bổ lại quét trên toàn hệ thống mà không ảnh hưởng đến việc sử dụng không gian ảnh chụp nhanh (lớn tiền thưởng, cảm ơn bạn NetApp). Tôi hy vọng rằng điều này sẽ loại bỏ các vấn đề trục nóng. Tôi có một số trước khi số liệu thống kê, và tôi sẽ kéo ra một số sau khi số liệu thống kê vào tuần tới. Tôi sẽ cập nhật bài viết cho phù hợp.
Bài học từ câu chuyện? Thiết lập hệ thống lưu trữ của bạn Hoàn toàn và triệt để trước khi bạn bắt đầu ném dữ liệu vào nó. Không nhận được vui mừng về việc sử dụng đồ chơi lưu trữ mới của bạn và ném dữ liệu trên đó ngay lập tức. Tôi đã thấy kịch bản ở trên nhiều lần, và trước khi đến ONTAP 7,3, đó là một nỗi đau để khắc phục.
Ảnh chụp nhanh của đầu ra số liệu thống kê. Hãy nhớ rằng trên một cluster này sẽ hiển thị tất cả các đĩa, vì vậy tất cả các số liệu thống kê đĩa là hoàn toàn có liên quan. Các đĩa bận rộn ở đây không tăng lên với số lượng thực tế của ổ đĩa trong hệ thống, và bạn rõ ràng có thể nhìn thấy một đĩa bận rộn.
based on 1 rating> Sysstat-u 1
Net kB / s đĩa kB / s kB / s Tape Cache Cache CPU Tổng số CP CP đĩa
ops / s ra đọc viết đọc viết tuổi thời nhấn ty util
11% 3220 6942 3270 4232 0 0 0 12 95% 0% - 60%
11% 2898 7385 4030 4892 0 0 0 11 94% 0% - 69%
9% 3547 1820 3496 3920 24 0 0 11 93% 0% - 89%
7% năm 2329 1160 3048 3892 0 0 0 11 93% 0% - 81%
10% 3173 2055 4851 4644 8 0 0 11 93% 0% - 67%
9% 2491 1860 4547 4568 24 0 0 11 91% 0% - 98%
9% năm 2523 2960 4404 5372 0 0 0 11 90% 0% - 89%
14% 5136 8173 4465 3352 0 0 0 11 95% 0% - 81%> Đĩa số liệu thống kê chương trình: *: disk_busy
... Snip ...
... Snip ...










































Một điểm quan trọng là bạn không nên thêm chỉ có một đĩa đơn khi bạn thay đổi kích thước tổng hợp nếu nó gần như đầy đủ, hầu hết các dữ liệu mới được ghi vào đĩa thêm. Như vậy, hiệu suất thực sự là xấu!
Tôi đề nghị: tạo ra các tập hợp lớn thay vì những người ít nhiều. Thêm đĩa để tổng hợp khi sử dụng trên 80%. Và có, sử dụng Cố vấn Hiệu suất và Ngưỡng để theo dõi hiệu suất của bạn!
Chris - một số lời khuyên thực sự tốt ở đó! Vui mừng bạn đang viết một lần nữa
Cheers cho thông tin phản hồi, cảm thấy tốt để thực sự có được cơ hội để viết một cái gì đó một lần nữa!
Và có thêm đĩa đơn là một điều kinh khủng. Tôi biết một người nào đó mua 1 đĩa một tháng bởi vì đó là ngân sách của họ hoạt động như thế nào. Tôi ghét điều này, và cố gắng để có được chúng để lưu trữ chúng và thêm chúng với số lượng lớn ít nhất. Không giúp với quản lý tài khoản của họ khuyến khích họ làm điều này có thể gọi đó là lưu trữ theo yêu cầu!
Shocking!
Bạn đề cập đến "chạy một số quét tái phân bổ trên toàn hệ thống mà không ảnh hưởng đến ảnh chụp không gian" là một tính năng mới với 7.3.2. Có thể là một ý tưởng cho một blog entry khác sẽ được giải thích điều này nhiều hơn một số, và lý do tại sao nó quan trọng. Tôi hiểu (trước đây) mà việc tái phân bổ sẽ đổ tất cả các công việc vào các bức ảnh chụp, nhưng tôi không nhận thức được sự thay đổi trong 7.3.2 bạn đề cập đến sửa chữa / thay đổi này.
Hy vọng rằng tôi sẽ được chạy thông qua vào cuối tuần, vì vậy tôi sẽ có thể cung cấp cho một số ví dụ thế giới thực sự của cách làm việc này.
Tất nhiên bạn có thể luôn luôn khe cắm ổ đĩa đơn mới vào một kệ hàng tháng, nhưng để chúng nhàn rỗi như phụ tùng cho đến khi bạn nhận được giá trị đầy đủ của nhóm RAID ... chỉ cần không nói với họ rằng
Lúc rick rhodes
Việc tái phân bổ mới trong 7.3.x là vật lý phân bổ lại (tái phân bổ-p, xem trang người đàn ông). Và thậm chí nếu bạn mở rộng một tổng hợp với thời hạn sử dụng toàn bộ hoặc nhiều hơn, bạn vẫn có thể muốn làm một vật lý tái phân bổ tất cả các khối lượng trong tổng hợp, ngay cả khi bạn không có đĩa nóng. Bằng cách đó, bạn có thể sọc các dữ liệu trên nhiều hơn cọc, do đó, nó sẽ mang lại hiệu suất cao hơn (đọc) dữ liệu hiện có là tốt.
Trên thực tế các trang hướng dẫn sử dụng nói rằng "tái phân bổ-p" không nên được sử dụng để lây lan dữ liệu trên đĩa. Đề nghị làm tái phân bổ đối với từng khối lượng trong tổng hợp mở rộng.
Bạn không chắc chắn tác động thực tế của việc này là gì, tôi đã không có một hệ thống để thử này mà trên đó sẽ thấy những cải thiện lớn.
Hi,
Đây là một bài viết tuyệt vời
Chỉ cần một câu hỏi nhỏ
đĩa: 88922F61: C2026AF9: E5D68A17: B49415B1: 00000000:00000000:00000000:00000000
Làm thế nào tôi có thể tìm ra tổng hợp đĩa này thuộc về?
Tôi đã thử với chương trình đĩa và đĩa chương trình lưu trữ, aggr tình trạng-r
Nhưng không thể tìm thấy bất kỳ
Kính trọng,
Thật không may, tôi không chắc chắn 100%. Đó là "danh sách công việc phải làm" của tôi và tôi đã chưa tìm ra cách để dịch các không gian địa chỉ "lệnh" số liệu thống kê cung cấp cho bạn vào một cái gì đó có thể sử dụng trong điều kiện của địa chỉ đĩa thực tế hoặc địa điểm. Xin lỗi này không giúp bạn nhiều
KB ID: 1010747
https://kb.netapp.com/support/index?page=content&id=1010747
Đó là tuyệt vời! Cảm ơn bạn!
Tôi rất tò mò dấu hiệu cần thiết để chạy "tái phân bổ" là gì, ngoài việc có một đĩa với 99% bận rộn?
Cảm ơn
Chính xác những gì đang tìm kiếm trong Perf.monitor? Độ trễ, ops / giây?
Hi Vladimir,
Chạy "tái phân bổ hiện nay được coi là thực hành khá tốt trên một loạt các LUNs. Bất cứ điều gì mà sẽ đạt được một lợi ích từ lớn lần đọc tuần tự là một ứng cử viên tốt cho một thường xuyên lên kế hoạch tái phân bổ, nhưng cũng có nhiều loại khác nhau phổ biến của LUNs sẽ được hưởng lợi anyway.
Mặc dù hệ thống con đĩa NetApp làm một công việc rất tốt của việc đặt dữ liệu trong khối lớn và các sọc trên các đĩa, nó chỉ có thể làm như vậy hoặc là bởi vì một hệ thống rất bận rộn hoặc vì các đĩa rất đầy đủ. Chạy 1 tái phân bổ sau đó là quá trình để nó có thể là thời gian để đảm bảo dữ liệu được đặt ra hoàn toàn đồng đều.
Tôi có thể là thận trọng của hoạt động tái phân bổ nếu các đĩa đã được 99% bận rộn, tái phân bổ sẽ đặt một tải trọng lớn hơn vào họ để có một khoảng thời gian khi dữ liệu được phân bổ lại. Tôi muốn khuyên bạn nên làm điều này trong một cửa sổ duy trì, hoặc ngoài giờ.