10 sự thật bạn cần biết về máy học

Tác giả:Giấc mơ nhỏ, Tạo: 2017-09-20 09:14:41, Cập nhật:

10 sự thật bạn cần biết về máy học

Là một người thường xuyên giải thích về máy học cho những người không chuyên nghiệp, tôi đã sắp xếp 10 điểm sau đây như một số lời giải thích về máy học.

  • Một, machine learning có nghĩa là học từ dữ liệu; còn AI là một từ thời trang.

    Học máy không giống như quảng cáo điên cuồng: bạn có thể giải quyết vô số vấn đề bằng cách cung cấp dữ liệu đào tạo thích hợp cho các thuật toán học tập thích hợp. Hãy gọi nó là AI nếu nó giúp bán hệ thống AI của bạn.

  • 2, Học máy chủ yếu liên quan đến dữ liệu và các thuật toán, nhưng dữ liệu là chủ yếu.

    Có rất nhiều điều thú vị về các thuật toán học máy, đặc biệt là những tiến bộ trong học tập sâu. Nhưng dữ liệu là yếu tố quan trọng làm cho việc học máy trở nên có thể.

  • 3, trừ khi bạn có rất nhiều dữ liệu, bạn nên bám vào mô hình đơn giản.

    Máy học đào tạo mô hình dựa trên các mẫu trong dữ liệu, khám phá không gian mô hình có thể được định nghĩa bởi các tham số. Nếu không gian tham số quá lớn, nó sẽ quá phù hợp với dữ liệu đào tạo và đào tạo một mô hình không thể tổng quát bản thân. Nếu bạn muốn giải thích chi tiết về điều này, bạn cần phải thực hiện nhiều tính toán toán hơn, và bạn nên sử dụng điều này như một nguyên tắc để làm cho mô hình của bạn đơn giản nhất có thể.

  • 4, chất lượng của máy học có liên quan mạnh đến chất lượng của dữ liệu được sử dụng để đào tạo.

    Người ta thường nói rằng bạn nhập một đống rác vào máy tính, và kết quả sẽ là một đống dữ liệu rác. Mặc dù câu nói này xuất hiện trước khi máy học, nhưng đây chính là hạn chế quan trọng của việc học máy.

  • 5, Học máy chỉ có thể hoạt động nếu dữ liệu đào tạo là đại diện.

    oi Như tài khoản đầu tư cảnh báo, hiệu suất trong quá khứ không đảm bảo kết quả trong tương lai. Máy học cũng nên đưa ra một tuyên bố cảnh báo tương tự: nó chỉ có thể hoạt động dựa trên dữ liệu được phân bố giống như dữ liệu đào tạo. Do đó, cần phải cảnh giác với sự lệch giữa dữ liệu đào tạo và dữ liệu sản xuất và thường xuyên lặp lại mô hình đào tạo để đảm bảo nó không bị lỗi thời.

  • 6, phần lớn công việc của máy học là chuyển đổi dữ liệu.

    Dưới sự quảng cáo của công nghệ học máy, bạn có thể nghĩ rằng việc học máy chủ yếu là lựa chọn và điều chỉnh các thuật toán. Nhưng thực tế là không có gì đáng ngạc nhiên: hầu hết thời gian và năng lượng của bạn sẽ được dành cho việc dọn dẹp dữ liệu và kỹ thuật đặc điểm, tức là chuyển đổi các đặc điểm nguyên bản thành các đặc điểm có thể đại diện tốt hơn cho tín hiệu dữ liệu.

  • 7, Học sâu là một bước tiến mang tính cách mạng, nhưng không phải là thuốc chữa bệnh.

    Học tập sâu cũng được quảng bá như một đống rắc rối vì việc học máy được áp dụng và phát triển trong nhiều lĩnh vực khác nhau. Ngoài ra, học tập sâu đã thúc đẩy việc tự động hóa một số công việc được thực hiện truyền thống thông qua kỹ thuật đặc điểm, đặc biệt là đối với dữ liệu hình ảnh và video. Nhưng học tập sâu không phải là thuốc chữa bệnh. Không có sản phẩm sẵn sàng để bạn sử dụng, bạn vẫn cần phải đầu tư rất nhiều năng lượng để dọn dẹp và chuyển đổi dữ liệu.

  • 8. Hệ thống học máy dễ bị ảnh hưởng bởi lỗi của người vận hành.

    Xin lỗi NRA, các thuật toán học máy không giết người, mà là người giết người. Khi hệ thống học máy bị lỗi, hiếm khi là do các thuật toán học máy có vấn đề. Nhiều khả năng hơn là lỗi nhân tạo được đưa vào dữ liệu đào tạo, dẫn đến sai lệch hoặc lỗi hệ thống khác. Chúng ta nên luôn luôn có thái độ nghi ngờ và xử lý máy học theo cách áp dụng cho kỹ thuật phần mềm.

  • 9, Máy học có thể vô tình tạo ra một lời tiên tri tự hoàn thành.

    Trong nhiều ứng dụng của máy học, quyết định bạn đưa ra hôm nay sẽ ảnh hưởng đến dữ liệu đào tạo mà bạn thu thập vào ngày mai. Một khi hệ thống học máy tích hợp sai lệch vào mô hình, nó có thể tiếp tục tạo ra dữ liệu đào tạo mới được tăng sai lệch. Và, một số sai lệch có thể hủy hoại cuộc sống của mọi người.

  • 10. AI sẽ không tự thức dậy, phản kháng và hủy diệt con người.

    Nhiều người dường như lấy ý tưởng về trí tuệ nhân tạo từ các bộ phim khoa học viễn tưởng. Chúng ta nên lấy cảm hứng từ khoa học viễn tưởng, nhưng chúng ta không thể nhầm tưởng rằng tiểu thuyết là thực tế. Từ con người có ý thức xấu xa đến các mô hình học máy có sai lệch vô thức, có quá nhiều thực tế và nguy hiểm để lo lắng. Vì vậy, bạn không cần phải lo lắng về SkyNet và Superintelligence.

    Những gì liên quan đến máy học còn xa hơn cả 10 điểm tôi đã đề cập ở trên. Hy vọng những nội dung giới thiệu này sẽ hữu ích cho những người không chuyên nghiệp.

Được chuyển từ Global AI Big Data Plateau


Thêm nữa