Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
TradFi
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Pre-IPOs
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
#OORT #百倍币 #AI #datahub
“Data annotation” là gì và vai trò của nó
Đánh dấu dữ liệu là một bước quan trọng trong lĩnh vực học sâu của trí tuệ nhân tạo (AI). Đó là việc gắn nhãn trước cho "dữ liệu hình ảnh và các loại dữ liệu khác" mà trí tuệ nhân tạo (máy tính) cần nhận dạng và phân biệt, để trí tuệ nhân tạo (máy tính) liên tục nhận dạng các đặc điểm của "dữ liệu hình ảnh và các loại dữ liệu khác" này và thiết lập "mối quan hệ tương ứng" với "nhãn", cuối cùng thực hiện việc trí tuệ nhân tạo (máy tính) có thể tự nhận dạng "dữ liệu hình ảnh và các loại dữ liệu khác" này.
Ví dụ, để cho trí tuệ nhân tạo (máy tính) có thể nhận diện máy bay, cần cung cấp một lượng lớn hình ảnh máy bay khác nhau và thiết lập nhãn "đây là máy bay", để trí tuệ nhân tạo (máy tính) học từng lần. Ý nghĩa của việc gắn nhãn dữ liệu là cung cấp dữ liệu huấn luyện chính xác, đáng tin cậy cho thuật toán máy học, từ đó nâng cao hiệu suất và độ chính xác của mô hình. Thông qua việc gắn nhãn dữ liệu, mô hình máy học có thể học được đặc điểm và quy luật của dữ liệu, từ đó thực hiện các nhiệm vụ phân loại, nhận diện, dự đoán và nhiều nhiệm vụ khác.
Một, Nhãn dữ liệu là gì? Trong những năm gần đây, là một công nghệ cốt lõi của trí tuệ nhân tạo (AI), học sâu đã đạt được nhiều bước tiến quan trọng trong lĩnh vực xử lý hình ảnh, giọng nói, văn bản, v.v.
Trí tuệ nhân tạo là trí tuệ được tạo ra bởi máy móc, trong lĩnh vực máy tính được hiểu là chương trình máy tính dựa trên nhận thức môi trường, thực hiện hành động hợp lý và đạt được lợi ích tối đa. Nghĩa là, để thực hiện trí tuệ nhân tạo, cần phải dạy cho máy tính khả năng hiểu và đánh giá vấn đề giống con người, để máy tính có khả năng nhận diện tương tự con người.
Khi con người tiếp xúc với một thứ mới, trước hết họ cần tạo ra ấn tượng ban đầu về thứ đó. Ví dụ, để cho trí tuệ nhân tạo (máy tính) có thể nhận diện máy bay, cần cung cấp một lượng lớn ảnh máy bay đa dạng và thiết lập nhãn "đây chính là máy bay", để trí tuệ nhân tạo (máy tính) học từng bước. Gán nhãn dữ liệu có thể coi như là việc mô phỏng quá trình học kinh nghiệm của con người, tương đương với việc con người lấy kiến thức có sẵn từ sách. Trong thực tế, việc gán nhãn dữ liệu đặt nhãn trước cho các hình ảnh cần máy tính nhận diện và phân biệt, giúp máy tính liên tục nhận diện đặc điểm của những hình ảnh này, cuối cùng thực hiện việc máy tính có thể tự nhận diện. Gán nhãn dữ liệu cung cấp một lượng lớn dữ liệu có nhãn cho các doanh nghiệp trí tuệ nhân tạo, cung cấp dữ liệu cho việc huấn luyện và học máy, đảm bảo hiệu quả của mô hình thuật toán.
二、Các loại nhãn dữ liệu phổ biến
Có ba loại chú thích dữ liệu phổ biến: chú thích hình ảnh, chú thích âm thanh và chú thích văn bản.
1. Đánh dấu hình ảnh
Đánh dấu hình ảnh bao gồm đánh dấu hình ảnh và đánh dấu video, vì video cũng được tạo thành từ các hình ảnh liên tiếp. Đánh dấu hình ảnh thường yêu cầu những người đánh dấu sử dụng các màu sắc khác nhau để nhận dạng đường viền của các mục tiêu khác nhau, sau đó gán nhãn tương ứng cho các đường viền đó, sử dụng nhãn để tóm tắt nội dung bên trong đường viền, để mô hình thuật toán có thể nhận ra các mục tiêu khác nhau trong hình ảnh. Đánh dấu hình ảnh thường được sử dụng trong các ứng dụng như nhận dạng khuôn mặt, nhận dạng xe tự động, v.v.
2、Ghi chú âm thanh
Ghi chú âm thanh liên kết nội dung văn bản đã được chuyển đổi bằng mô hình thuật toán và liên kết logic với âm thanh tương ứng. Các kịch bản ứng dụng của ghi chú âm thanh bao gồm xử lý ngôn ngữ tự nhiên, dịch thông qua thời gian thực và phương pháp thông dụng của ghi chú âm thanh là chuyển đổi giọng nói.
3、Đánh dấu văn bản
Ghi chú văn bản đề cập đến việc chú thích nội dung văn bản dựa trên các tiêu chuẩn hoặc nguyên tắc nhất định như tách từ, đánh giá ngữ nghĩa, đánh dấu từ loại, dịch văn bản, rút trích chủ đề sự kiện và các công việc chú thích khác. Các kịch bản ứng dụng bao gồm nhận dạng thẻ danh thiếp, nhận dạng giấy tờ chứng minh và nhiều công việc khác. Hiện nay, các nhiệm vụ ghi chú văn bản phổ biến bao gồm ghi chú cảm xúc, ghi chú thực thể, ghi chú từ loại và các loại ghi chú văn bản khác.
Ba. Công việc gắn nhãn dữ liệu phổ biến
Các nhiệm vụ chú thích dữ liệu phổ biến bao gồm chú thích phân loại, chú thích hộp, chú thích khu vực, chú thích điểm, chú thích hợp nhất 2D, 3D, chú thích điểm đám mây và chú thích đoạn thẳng.
1. Phân loại nhãn: Được hiểu là chọn nhãn phù hợp từ tập hợp các nhãn đã cho và gán cho đối tượng được đánh dấu.
2、Đánh dấu khung chọn: chỉ định đối tượng cần phát hiện từ hình ảnh, phương pháp này chỉ áp dụng cho việc đánh dấu hình ảnh.
3、Đánh dấu khu vực: So với việc đánh dấu khung, yêu cầu của việc đánh dấu khu vực cần phải chính xác hơn và cạnh có thể linh hoạt, và chỉ giới hạn trong việc đánh dấu hình ảnh, các trường hợp ứng dụng chính bao gồm nhận diện đường và bản đồ tự động lái xe.
4、Đánh dấu điểm: Đề cập đến việc nhận dạng các điểm chính xác trên các yếu tố cần được đánh dấu (như khuôn mặt, cơ thể) theo vị trí yêu cầu, nhằm nhận dạng các điểm quan trọng trên các vị trí cụ thể.
5. Chú thích hợp nhất 2D và 3D: đề cập đến việc chú thích đồng thời dữ liệu hình ảnh được thu thập bởi các cảm biến 2D và 3D và thiết lập liên kết.
6. Đánh dấu điểm đám mây: Đánh dấu điểm đám mây là một cách quan trọng để biểu thị dữ liệu ba chiều. Thông qua cảm biến như lidar, chúng ta có thể thu thập được các vật cản và tọa độ vị trí của chúng. Các nhân viên đánh dấu sau đó phải phân loại các điểm đám mây dày đặc này và gắn thêm các thuộc tính khác nhau.
7. Đánh dấu đoạn thẳng: Chủ yếu sử dụng đoạn thẳng để đánh dấu cạnh và đường viền của đối tượng hình ảnh bằng đoạn thẳng.
Ý nghĩa của việc ghi chú dữ liệu
Ý nghĩa của việc gắn nhãn dữ liệu là cung cấp dữ liệu huấn luyện chính xác và đáng tin cậy cho thuật toán máy học, từ đó nâng cao hiệu suất và độ chính xác của mô hình. Thông qua việc gắn nhãn dữ liệu, mô hình máy học có thể học được đặc điểm và quy luật của dữ liệu, từ đó thực hiện các nhiệm vụ phân loại, nhận dạng, dự đoán, v.v. Cụ thể, việc gắn nhãn dữ liệu có thể nâng cao hiệu suất của mô hình. Dữ liệu đã được gắn nhãn có thể giúp mô hình hiểu rõ cấu trúc và mẫu dữ liệu bên trong, từ đó nâng cao khả năng phân loại, nhận dạng hoặc dự đoán của mô hình. Việc gắn nhãn dữ liệu có thể mở rộng phạm vi ứng dụng của mô hình. Thông qua việc gắn nhãn dữ liệu từ các lĩnh vực và cảnh quan khác nhau, có thể khiến mô hình thích nghi với nhiều cảnh quan ứng dụng hơn, từ đó mở rộng phạm vi ứng dụng của nó. Tóm lại, việc gắn nhãn dữ liệu đóng vai trò rất quan trọng trong lĩnh vực máy học và trí tuệ nhân tạo, không chỉ là bước quan trọng để nâng cao hiệu suất mô hình mà còn là cơ sở quan trọng để thúc đẩy quyết định dựa trên dữ liệu.