• Khám phá. Học hỏi. Phát triển. Mạng lưới truyền thông Fastlane

  • thương mại điện tửFastlane
  • POD Đường nhanh
  • SEOfastlane
  • Cố vấnFastlane
  • Người trong cuộc Fastlane

Tangle: Một nền tảng thử nghiệm học máy mã nguồn mở được xây dựng để mở rộng quy mô (2025) – Shopify

Tangle: Một nền tảng thử nghiệm học máy mã nguồn mở được xây dựng để mở rộng quy mô (2025) – Shopify

Bài viết bởi Alexey Volkov, Kỹ sư cấp cao, Bộ phận Sản phẩm và Công cụ Tìm kiếm

Chuyển đến phần bắt đầu

Thí nghiệm của bạn cuối cùng cũng kết thúc. Sáu giờ sau, đồng đội yêu cầu bạn làm lại thí nghiệm. Bạn không nhớ mình đã sử dụng phiên bản notebook nào, liệu bạn có lấy dữ liệu mới hay không, hoặc bạn đã thay đổi những tham số nào lúc 2 giờ sáng. Giờ đây, bạn lại phải thực hiện một lần chạy tám tiếng nữa, chỉ để... có lẽ Hãy làm lại những gì bạn đã làm trước đó.

Việc phát triển máy học không nên diễn ra theo cách này, nhưng thực tế lại là như vậy. 80% thời gian phát triển được dành cho kỹ thuật dữ liệu., không phải thuật toán.

Các đội trên khắp Shopify cảm nhận được nỗi đau này, đặc biệt là Tìm kiếm & Khám phá Hệ thống này xếp hạng hàng triệu sản phẩm dựa trên hàng tỷ truy vấn. Chúng tôi không thể chấp nhận sự bất cập này. 

Vì vậy chúng tôi đã xây dựng Bị rốiĐây là nền tảng thử nghiệm học máy mà chúng tôi đã kiểm nghiệm kỹ lưỡng ở quy mô thương mại. Kể từ khi sử dụng, chúng tôi đã tiết kiệm được hơn một năm thời gian tính toán.

Hôm nay, chúng tôi đã công khai mã nguồn của nền tảng này.

Vì sao chúng tôi công khai mã nguồn Tangle?

ShopifyNhóm Tìm kiếm & Khám phá của công ty đã xây dựng Tangle (ban đầu là Cloud Pipeline Studio, một công cụ tôi đã xây dựng trước khi gia nhập công ty). Shopify) để đẩy nhanh quá trình thử nghiệm ML mà không làm giảm độ tin cậy. 

Tangle đang chứng tỏ sự hữu ích đối với các nhóm trên toàn Shopify. Nó hoạt động hiệu quả ở quy mô của chúng tôi. Các nhà khoa học dữ liệu có thể lặp lại quy trình nhanh hơn. Các kỹ sư phải duy trì ít mã pipeline tùy chỉnh hơn. Các thành viên trong nhóm chia sẻ pipeline và các lần chạy. Chi phí cơ sở hạ tầng giảm nhờ bộ nhớ đệm toàn cầu.

Shopify cam kết làm cho web trở nên tốt hơn bao giờ hết thông qua các đóng góp mã nguồn mở. Chúng tôi biết cộng đồng học máy rộng lớn hơn cũng đang đối mặt với những thách thức tương tự, vì vậy việc công khai mã nguồn Tangle là một quyết định hiển nhiên. Bằng cách này, chúng ta có thể mở rộng tầm ảnh hưởng của Tangle và mời gọi sự hợp tác từ các nhà nghiên cứu và chuyên gia trên toàn thế giới.

Vấn đề: Sáu chế độ thất bại trong phát triển ML

  1. Các kỹ sư phải nhớ từng truy vấn tùy chỉnh mà họ viết. Đối với mỗi thí nghiệm, việc ghi nhật ký để theo dõi truy vấn nào được sử dụng ở giai đoạn nào có thể gây ra lỗi và làm chậm quá trình. 
  2. Sổ tay tích lũy Không có cấu trúc. 
  3. Chuẩn bị dữ liệu kéo dài hàng giờ Thí nghiệm thường được lặp đi lặp lại.
  4. Không thể tái tạo Kết quả cũ. 
  5. Quá trình triển khai mất nhiều thời gian hơn. hơn là huấn luyện.
  6. Không có chuyện chia sẻ. Thành viên nhóm không thể hỗ trợ hoặc thử các phương án riêng của họ.

Hầu hết các nền tảng chỉ giải quyết được một số lỗi này chứ không phải tất cả. Chúng tôi quyết định thử và giải quyết tất cả bằng Tangle.

Giải pháp của chúng tôi: Quy trình trực quan + bất kỳ mã nào

Tangle là một nền tảng thử nghiệm mã nguồn mở, không phụ thuộc vào nền tảng, cho phép các nhóm xây dựng các quy trình xử lý dữ liệu và học máy thông qua giao diện trực quan và thực thi chúng trong môi trường đám mây mà không cần thiết lập môi trường phát triển cục bộ.

Một số công cụ hiện có chỉ có thể thực hiện xử lý dữ liệu chuyên biệt hoặc chỉ có thể huấn luyện máy học, nhưng Tangle có thể thực hiện tất cả những điều đó trong một quy trình duy nhất theo bất kỳ sự kết hợp nào—cùng với bất kỳ quá trình xử lý phi truyền thống nào khác mà bạn cần. Nó thậm chí còn xử lý các tác vụ không liên quan đến xử lý dữ liệu như triển khai mô hình, sử dụng người đánh giá để thu thập nhãn kết quả và tính toán các chỉ số dựa trên đánh giá của con người.

Hãy coi Tangle như chất keo kết nối mọi thứ trong quy trình làm việc của bạn, bất kể chúng có không tương thích đến mức nào, cho dù bạn đang kết nối các thành phần được viết bằng các ngôn ngữ khác nhau hay tích hợp các công cụ không được thiết kế để hoạt động cùng nhau.

Nền tảng này được xây dựng dựa trên những nguyên tắc cơ bản sau:

Nền tảng Agnostic

Tangle tích hợp với các cơ sở mã hiện có trên mọi ngôn ngữ lập trình và chạy trên mọi nhà cung cấp dịch vụ đám mây hoặc cơ sở hạ tầng cục bộ mà không cần sửa đổi mã.

Bộ nhớ đệm mạnh mẽ

Hệ thống theo dõi quá trình thực thi tác vụ và các sản phẩm tạo ra, cho phép tự động tái sử dụng các phép tính trùng lặp trên tất cả các lần chạy quy trình từ các thành viên nhóm. Kết quả mất hàng giờ để tạo ra được tự động tái sử dụng từ bộ nhớ đệm chỉ trong vài giây. Và không giống như các hệ thống khác, Tangle không chỉ có thể tái sử dụng các tác vụ đã thực thi thành công hoàn toàn, mà còn cả những tác vụ vẫn đang chạy.

Chỉnh sửa quy trình trực quan

Các nhà phát triển xây dựng các quy trình xử lý dữ liệu thông qua giao diện kéo thả tương tác, hiển thị toàn bộ luồng dữ liệu dưới dạng đồ thị có hướng không chu trình (DAG), cung cấp khả năng hiển thị tức thì về cấu trúc quy trình mà không cần phân tích mã notebook.

kiến trúc trung lập về ngôn ngữ

Các thành phần của Tangle bao bọc các chương trình dòng lệnh hiện có tùy ý đọc và ghi tệp (thay vì yêu cầu người dùng viết lại mã của họ bằng một số cấu trúc dành riêng cho khung). Nó hỗ trợ các thành phần được viết bằng Python, Shell, Javascript, C#, C++, Rust, Java, Go, R hoặc bất kỳ ngôn ngữ nào có khả năng thực thi CLI.

Kiến trúc: Cách thức hoạt động của Tangle

Kiến trúc của Tangle tuân theo một hệ thống phân cấp đơn giản:

  • thành phần: Về mặt khái niệm, nó tương tự như định nghĩa hàm — một đặc tả có thể tái sử dụng mô tả siêu dữ liệu của thành phần (tên, mô tả, chú thích), giao diện (đầu vào/đầu ra) và cách triển khai (một dòng lệnh mẫu của chương trình CLI được đóng gói trong container, hoặc một đồ thị các tác vụ).
  • Bài tập, nhiệm vụ: Về mặt khái niệm, nó tương tự như một dòng lệnh gọi hàm trong mã lập trình — một thể hiện được cấu hình của thành phần với các đối số đầu vào được chỉ định.
  • Chấp hành: Về mặt khái niệm, nó tương tự như việc gọi một hàm — khi bạn gửi một pipeline, mỗi tác vụ sẽ được thực thi và tạo ra các sản phẩm đầu ra.
  • Biểu đồ: Một đồ thị thể hiện các tác vụ được kết nối, trong đó đầu ra của một tác vụ được truyền đến một tác vụ khác dưới dạng đầu vào.
  • Đường ống: Một thành phần đồ thị gốc; cách triển khai của nó là một đồ thị các tác vụ.

Mô hình khai báo này mang lại nhiều ưu điểm so với các phương pháp tập trung vào mã nguồn. Các thành phần là các tệp YAML dạng văn bản thuần túy, có thể được tổ chức thành thư viện, lập chỉ mục, tìm kiếm và tải an toàn từ bất kỳ nguồn nào (GitHub, web hoặc lưu trữ đám mây). Không giống như các gói Python được cài đặt toàn cục, các thành phần có thể được quản lý phiên bản độc lập — người dùng có thể tham chiếu các phiên bản chính xác bằng mã băm nội dung, kết hợp các phiên bản thành phần khác nhau trong cùng một quy trình để so sánh và chia sẻ các phiên bản thành phần cụ thể mà không gặp phải vấn đề phụ thuộc phức tạp.

Các thành phần: Khối xây dựng có thể tái sử dụng

Thành phần (component) là một đơn vị chức năng độc lập được định nghĩa bởi đặc tả YAML. Các thành phần tuân theo một hợp đồng rõ ràng: chúng chấp nhận đầu vào, thực hiện một nhiệm vụ cụ thể, tạo ra đầu ra và hoạt động hoàn toàn độc lập.

Dưới đây là một ví dụ về đặc tả linh kiện:

Các thành phần được thiết kế như những hàm thuần túy: mang tính xác định (đầu vào giống nhau tạo ra đầu ra giống nhau) và không có tác dụng phụ. Điều này cho phép lưu trữ bộ nhớ đệm hiệu quả và tái sử dụng các thành phần. 

Thiết kế không phụ thuộc vào ngôn ngữ

Các thành phần Tangle mô tả các chương trình CLI được đóng gói tùy ý mà không cần phải biết đến Tangle. Điều này mang lại ba lợi thế:

  1. Tính trung lập về ngôn ngữ: Viết các thành phần bằng bất kỳ ngôn ngữ nào hỗ trợ thực thi dòng lệnh (CLI).
  2. Điều phối phân tán: Các thành phần được thực thi trên các máy khác nhau vào các thời điểm khác nhau mà không có yêu cầu thời gian chạy chung.
  3. Cách ly rõ ràng: Các thùng chứa cho phép thực thi kín mà không gây ô nhiễm trạng thái.

Vì thành phần container mô tả dòng lệnh của một chương trình CLI tùy ý, người dùng có thể tạo các thành phần dựa trên các đoạn mã nhỏ nội tuyến mà không cần phải đặt mã người dùng bên trong container.

Dưới đây là một ví dụ về thành phần mã Python nội tuyến (Lưu ý rằng đối với các nhà phát triển Python, có một tính năng gọi là Trình tạo thành phần Python nhẹ (Lightweight Python Component Generator) giúp tạo ra các thành phần như vậy một cách tự động. Vì vậy, ở đây chúng ta chỉ đang minh họa khái niệm này):

Đây là một ví dụ về thành phần mã JavaScript nội tuyến:

Bộ nhớ đệm dựa trên nội dung

Hầu hết các nền tảng học máy sử dụng bộ nhớ đệm dựa trên nguồn gốc. Khi các thành phần phía trên thay đổi, tất cả các thành phần phía dưới phải thực thi lại. Tangle sử dụng bộ nhớ đệm dựa trên nội dung: các thành phần phía dưới kiểm tra mã băm nội dung đầu ra và sử dụng lại kết quả được lưu trong bộ nhớ đệm khi đầu ra vẫn giống nhau. Điều này dẫn đến một số cải tiến hiệu suất đáng kể:

Tác động thực tế: Một quy trình kéo dài 10 giờ có thể hoàn thành trong 20 phút chỉ khi chỉ có một thành phần thay đổi. Kết quả đầu ra hoàn toàn giống nhau.

Tái sử dụng hiện vật toàn cầu: Bộ nhớ đệm của Tangle hoạt động trên toàn cầu giữa tất cả người dùng. Khi ba nhà khoa học dữ liệu gửi các thí nghiệm có chung một bước tiền xử lý, Tangle sẽ thực hiện tiền xử lý một lần và cả ba quy trình đều chia sẻ kết quả – ngay cả đối với các quy trình vẫn đang chạy.

Kiến trúc luồng dữ liệu

Các thành phần của Tangle giao tiếp với nhau thông qua đường dẫn tệp, chứ không phải thông qua các đối tượng trong bộ nhớ:

  1. Nhà sản xuất viết đến đường đi địa phương
  2. Tải lên hệ thống lưu trữ (GCS, S3, v.v.)
  3. Người tiêu dùng đọc từ đường dẫn địa phương
  4. Hệ thống truy xuất trong suốt

Hệ thống thay thế các phần giữ chỗ bằng vị trí tệp thực tế trong quá trình chạy. Các thành phần thực hiện nhập/xuất tệp tiêu chuẩn trong khi việc lưu trữ vẫn được trừu tượng hóa.

Luồng thực thi

Khi bạn gửi một pipeline, trình điều phối của Tangle sẽ tự động quản lý việc thực thi:

  1. Các tác vụ trong hàng đợi: Mỗi tác vụ bắt đầu ở trạng thái chờ.
  2. Kiểm tra sự phụ thuộc: Chờ các tác vụ ở phía thượng nguồn hoàn tất và xác minh xem các tệp đầu vào có sẵn hay không.
  3. Kiểm tra bộ nhớ cache: Tính toán khóa bộ nhớ đệm thực thi và tìm kiếm các lần thực thi có thể tái sử dụng (đã thành công hoặc vẫn đang chạy).
  4. Thực thi hoặc tái sử dụng: Nếu tìm thấy kết quả trong bộ nhớ cache, hãy sử dụng lại các kết quả hiện có. Nếu không, hãy khởi chạy container trong cụm máy chủ đám mây.
  5. Theo dõi: Theo dõi trạng thái container, ghi lại nhật ký và cập nhật trạng thái thực thi.
  6. Hoàn thiện: Lưu trữ siêu dữ liệu của sản phẩm đầu ra (kích thước, mã băm, giá trị nhỏ) và báo hiệu cho các tác vụ tiếp theo.

Việc này diễn ra tự động. Bạn gửi dữ liệu, hệ thống điều phối, và bạn theo dõi kết quả.

Hệ thống loại tùy chọn

Tangle sử dụng kiểu dữ liệu tùy chọn — các kiểu dữ liệu cung cấp siêu dữ liệu cho các công cụ nhưng không bắt buộc. Điều đó có nghĩa là:

  • Các thành phần xác định loại đầu vào/đầu ra của chúng. (String, Float, JsonObject, ApacheParquet, TensorflowModel). Tên kiểu dữ liệu có thể tùy ý, nhưng cần được sử dụng nhất quán.
  • Hệ thống xử lý tất cả dữ liệu hiện vật dưới dạng các khối/chuỗi ký tự không rõ ràng. (hoặc thư mục).
  • Không có quy trình xác thực dữ liệu tập trung.—Các thành phần tiêu thụ tự xác thực đầu vào của chúng.

Đây là lý do thiết kế của chúng tôi:

  • Sự cởi mở: Bất kỳ người dùng/nhóm nào cũng có thể khai báo các loại chuyên biệt của riêng họ.
  • Hiệu suất: Không phát sinh chi phí xác thực trong quá trình chạy.
  • An ninh: Không phân tích các lỗ hổng từ quá trình xác thực tập trung.
  • Thích ứng với văn hoá: Khả năng tương thích phiên bản mà không cần lược đồ cứng nhắc

Trình chỉnh sửa trực quan: Phát triển quy trình

Tangle hiển thị các pipeline dưới dạng đồ thị có hướng không chu trình (DAC) tương tác, loại bỏ nhu cầu phân tích cú pháp mã notebook.

Xây dựng trực quan

  • Thêm các thành phần từ thư viện
  • Kết nối đầu ra thành đầu vào
  • Thiết lập tham số nội tuyến
  • Gửi với một cú nhấp chuột

Giám sát trong thời gian thực

  • Theo dõi trạng thái thực thi tác vụ
  • Xem hiện vật và nhật ký
  • Xác định các bước được lưu vào bộ nhớ cache
  • Spot tắc nghẽn hiệu suất

Lặp lại nhanh chóng

Mỗi lần chạy đều được lưu giữ đầy đủ thông tin về nguồn gốc. Điều này cho phép lặp lại nhanh chóng mà không làm mất lịch sử thí nghiệm.

Bắt đầu

Kiến trúc của Tangle cho phép nó hoạt động ở bất cứ đâu. Chúng tôi đang mở rộng danh sách các phương pháp cài đặt.

Hiện tại, Tangle có thể được sử dụng cục bộ (sử dụng trình khởi chạy Docker/Podman) hoặc trên HuggingFace (sử dụng trình khởi chạy tác vụ HuggingFace).

Hãy bắt đầu với HuggingFace

Cách dễ nhất để thử Tangle là thông qua HuggingFace.

Go đây và bắt đầu xây dựng. Việc tạo pipeline không yêu cầu đăng ký, nhưng để chạy pipeline, bạn cần có tài khoản HuggingFace. pro Đăng ký (9 đô la/tháng).

Xây dựng một đường ống

Hãy bắt đầu với quy trình huấn luyện XGBoost mẫu hoặc xây dựng một quy trình mới từ đầu:

  1. Kéo các thành phần lên vải bạt
  2. Kết nối các thành phần (đầu ra thành đầu vào)
  3. Thiết lập các đối số nhiệm vụ
  4. Gửi quy trình thực thi (yêu cầu đăng nhập)
  5. Màn Hình đường ống vận hành trong thời gian thực

Chỉnh sửa quy trình:

Giám sát quá trình chạy đường dẫn xử lý dữ liệu:

Xem danh sách tất cả các lần chạy pipeline của bạn:

Tích hợp HuggingFace x Tangle

Chúng tôi đã triển khai Tangle cho HuggingFace Spaces như một dịch vụ đa người dùng, sử dụng cơ sở hạ tầng của HF cho lưu trữ, tính toán và xác thực. 

Phiên bản dùng chung đa người dùng đã hoạt động. đây .

Kiến trúc đa người dùng của Tangle duy trì một cơ sở dữ liệu người dùng trung tâm (lưu trữ ID người dùng, mã thông báo truy cập và cấu hình trình điều phối) cùng với các cơ sở dữ liệu SQLite riêng biệt cho mỗi người dùng trong bộ nhớ lưu trữ bền vững TangleML/tangle HuggingFace Space chính. Các pipeline của mỗi người dùng được chạy thông qua các HuggingFace Jobs của người dùng đó, và nhật ký thực thi cũng như các tạo phẩm đầu ra được lưu trữ trong kho lưu trữ HuggingFace Dataset riêng tư của người dùng (user/tangle_data), với các liên kết có thể nhấp chuột trong giao diện người dùng đến cả các tạo phẩm và HuggingFace Jobs. 

Bạn cũng có thể triển khai phiên bản đơn người dùng của riêng mình. Bạn thực hiện điều này bằng cách sao chép không gian Tangle vào tài khoản HF của bạn và cung cấp một Mã thông báo HFCác triển khai Tangle dành riêng cho một người dùng này lưu trữ cơ sở dữ liệu của chúng trong bộ nhớ lưu trữ bền vững HF Space của riêng bạn, mang lại cho bạn quyền kiểm soát hoàn toàn và sự cô lập dữ liệu.

Nếu bạn sao chép Tangle vào một tổ chức, bạn sẽ nhận được một triển khai Tangle đa người dùng, độc lập cho nhóm của mình, nơi nhiều thành viên trong nhóm có thể xem các lần chạy pipeline của nhau và tận hưởng bộ nhớ đệm trên toàn tổ chức.

Bắt đầu từ địa phương

Hãy làm theo hướng dẫn cài đặt trên GitHub

  • đặt phu bến tàuuv.
  • Tải xuống mã ứng dụng (Chỉ cần thực hiện một lần):
  • Khởi động ứng dụng:
    Linux và Mac OS: cd tangle && backend/start_local.sh
    Windows: cd tangle && backendstart_local.cmd
  • Mở http://localhost:8000 URL trong trình duyệt websau đó “start_local: Khởi động trình điều phốiThông báo "" xuất hiện trong cửa sổ terminal và bạn có thể bắt đầu sử dụng ứng dụng. 
  • Nhấp vào nút “Tạo đường dẫn mới”. ở vị trí cao nhất để bắt đầu xây dựng một quy trình mới.

Tại sao nên chọn Tangle?

Tangle được xây dựng để giúp việc học máy trở nên hiệu quả hơn cho các nhóm và cá nhân.

Đối với tổ chức

  • Theo dõi và tái tạo tự động: Mỗi lần chạy pipeline đều được ghi lại đầy đủ thông tin: cấu trúc đồ thị, nhật ký thực thi, siêu dữ liệu tạo phẩm và số liệu. Dữ liệu trung gian là bất biến và không bao giờ bị ghi đè, giảm thiểu rủi ro khi thử nghiệm và cho phép chia sẻ an toàn giữa các nhóm. Các thành viên trong nhóm có thể sao chép lần chạy pipeline của bất kỳ đồng nghiệp nào, điều tra sự cố, sửa đổi tham số và gửi lại—tất cả đều được theo dõi tự động.
  • Tiết kiệm thời gian và sức mạnh tính toán: Các tác vụ đã thực hiện trước đó được tự động tái sử dụng thông qua bộ nhớ đệm dựa trên nội dung, giúp tiết kiệm cả thời gian thực thi và chi phí điện toán đám mây.
  • Thư viện linh kiện: Các nhóm xây dựng thư viện dùng chung gồm các thành phần có thể tái sử dụng, thiết lập các mô hình nhất quán và đẩy nhanh tốc độ phát triển.
  • Dễ hiểu đối với người không phải kỹ sư: Các nhà quản lý sản phẩm và nhà phân tích có thể tạo và chạy các quy trình tự động mà không cần viết mã hoặc thiết lập môi trường phát triển, cho phép họ thực hiện các thử nghiệm và theo dõi số liệu một cách độc lập.

Dành cho các kỹ sư cá nhân

  • Theo dõi không ma sát: Tự động lưu trữ phiên bản và lịch sử thực thi mà không cần ghi chép thủ công.
  • Không cần thiết lập bộ nhớ đệm thủ công: Dữ liệu được truyền tự động giữa các phép biến đổi với khả năng tái sử dụng thông minh—không cần logic bộ nhớ đệm tùy chỉnh.
  • Tích hợp không xâm phạm: Các thành phần bao bọc mã hiện có mà không cần sửa đổi, sử dụng bất kỳ chương trình CLI, ngôn ngữ hoặc vùng chứa nào.
  • Kiến thức có thể kết hợp: Các thành phần là những mẩu kiến ​​thức độc lập có thể tái sử dụng: mỗi thành phần hoạt động như một hàm đơn giản, chứ không phải một khung cấu trúc phức tạp. Quên cách viết vòng lặp huấn luyện TensorFlow? Hãy tham khảo một thành phần chỉ có 50 dòng thay vì phải đọc một hướng dẫn dài 1,000 dòng. Các thành phần độc lập với nhau, điều này có nghĩa là không có xung đột phụ thuộc và có thể được chia sẻ trên nhiều pipeline ngay cả khi sử dụng các phiên bản khác nhau cùng lúc để so sánh.
  • Khả năng tương tác ngôn ngữ: Kết nối các thành phần Python, Java, Shell, Ruby, C++ và JavaScript trong cùng một quy trình mà không gặp vấn đề về khả năng tương thích.

Đã được kiểm chứng qua thực chiến ở quy mô Shopify.

Tangle cung cấp sức mạnh cho cơ sở hạ tầng học máy trong sản xuất của nhóm Tìm kiếm & Khám phá của Shopify và nhiều đơn vị khác, xử lý hàng triệu truy vấn tìm kiếm và hàng tỷ sản phẩm. Chúng tôi sử dụng nó cho:

  • Mô hình xếp hạng sản phẩm trên hàng triệu SKU
  • Thử nghiệm tìm kiếm ngữ nghĩa ở quy mô truy vấn
  • Đào tạo hệ thống đề xuất 
  • Các quy trình xử lý đặc trưng theo thời gian thực

Lợi ích được đo lường

  • Tốc độ lặp: Các nhà khoa học dữ liệu triển khai các mô hình xếp hạng mới hàng ngày mà không cần phụ thuộc vào cơ sở hạ tầng.
  • Khả năng tái tạo hoàn toàn: Bất kỳ thí nghiệm nào từ sáu tháng trước đều có thể được tái tạo chỉ với hai cú nhấp chuột, kèm theo đầy đủ thông tin về nguồn gốc hiện vật.
  • Tối ưu hóa chi phí: Bộ nhớ đệm toàn cầu giúp loại bỏ hàng nghìn giờ tính toán dư thừa mỗi tháng.
  • Hợp tác nhóm: Thư viện thành phần dùng chung giúp tăng tốc quá trình phát triển và thiết lập các mô hình nhất quán.

Cái gì tiếp theo

Tangle đang được sử dụng ở quy mô sản xuất tại Shopify. Chúng tôi đang ưu tiên các tính năng trong tương lai dựa trên phản hồi từ cộng đồng. 

Tính năng theo kế hoạch

  • Hỗ trợ trực tiếp cho các nền tảng điện toán đám mây chính. (GCP đã được hỗ trợ, nhưng cần tài liệu hướng dẫn triển khai)
  • Thư viện linh kiện được mở rộng và nâng cao 
  • Hình ảnh hóa hiện vật 

Đồng hành cùng PN

Sao chúng ta on GitHub

???? Đọc các tài liệu

💬 Tham gia thảo luận on GitHub 

🐛 Góp phần: Các vấn đềPR chào mừng

Đây mới chỉ là khởi đầu. Chúng tôi rất hào hứng chờ xem cộng đồng ML sẽ định hình tương lai của Tangle như thế nào. Hãy thử nghiệm nó trong quy trình làm việc của bạn, chia sẻ phản hồi và cùng chúng tôi xây dựng nền tảng thử nghiệm tốt nhất. 


Nếu bạn quan tâm đến việc cùng chúng tôi thực hiện sứ mệnh làm cho thương mại tốt hơn cho mọi người, hãy xem thông tin chi tiết tại đây. trang nghề nghiệp.

Alexey Volkov là Kỹ sư cấp cao thuộc nhóm Sản phẩm và Công cụ Tìm kiếm.

Bài viết này ban đầu xuất hiện trên Kỹ thuật Shopify và có sẵn ở đây để tìm hiểu thêm.
Chiến lược tăng trưởng Shopify cho các thương hiệu bán hàng trực tiếp (DTC) | Steve Hutt | Cựu Quản lý Thành công Khách hàng Shopify | Hơn 440 tập podcast | 50 lượt tải xuống hàng tháng