Các nhà khoa học dữ liệu là chìa khóa để hiện thực hóa các cơ hội do dữ liệu lớn mang lại. Họ đưa ra cấu trúc cho nó, tìm ra các mẫu hấp dẫn trong đó và tư vấn cho các giám đốc điều hành về các tác động đối với sản phẩm, quy trình và quyết định. Họ tìm thấy câu chuyện bị chôn vùi trong dữ liệu và truyền đạt nó. Và họ không chỉ cung cấp các báo cáo: Họ đi vào các câu hỏi trọng tâm của vấn đề và đưa ra các phương pháp tiếp cận sáng tạo cho chúng. Ví dụ, một nhà khoa học dữ liệu đang nghiên cứu một vấn đề gian lận, nhận ra rằng nó tương tự như một loại vấn đề giải trình tự DNA. Mang những thế giới khác nhau đó lại với nhau, anh ấy đã tạo ra một giải pháp giúp giảm đáng kể tổn thất do gian lận.
Trong bài viết này, Davenport của Trường Kinh doanh Harvard và Patil của Greylock sẽ đi sâu về những điều mà các tổ chức cần biết về các nhà khoa học dữ liệu: tìm kiếm họ ở đâu, cách thu hút và phát triển họ cũng như cách phát hiện một nhà khoa học tuyệt vời.đóng
Khi Jonathan Goldman đến làm việc ở Tháng 6 năm 2006 tại LinkedIn, trang mạng kinh doanh, nơi vẫn còn giống như một công ty khởi nghiệp. Công ty chỉ có dưới 8 triệu tài khoản và con số này đang tăng lên nhanh chóng khi các thành viên hiện tại mời bạn bè và đồng nghiệp của họ tham gia. Nhưng người dùng đã không tìm kiếm kết nối với những người đã ở trên trang web với tốc độ mà các nhà điều hành đã mong đợi. Một điều gì đó dường như bị thiếu trong trải nghiệm xã hội Như một người quản lý LinkedIn đã nói, “Nó giống như đến một buổi tiệc chiêu đãi hội nghị và nhận ra rằng bạn không biết ai cả. Vì vậy, bạn chỉ cần đứng trong góc nhâm nhi đồ uống của mình — và bạn có thể về sớm. ” Goldman, tiến sĩ vật lý từ Stanford, bị hấp dẫn bởi sự liên kết mà ông đã thấy đang diễn ra và bởi sự phong phú của hồ sơ người dùng. Tất cả đều tạo ra dữ liệu lộn xộn và phân tích khó sử dụng, nhưng khi anh ấy bắt đầu khám phá các kết nối của mọi người, anh ấy bắt đầu nhìn thấy những khả năng. Anh ấy bắt đầu hình thành các lý thuyết, thử nghiệm linh cảm và tìm ra các mẫu cho phép anh ấy dự đoán mạng mà một cấu hình nhất định sẽ truy cập. Nhưng nhóm kỹ sư của LinkedIn, bị vướng vào những thách thức trong việc mở rộng quy mô trang web, dường như không quan tâm. Một số đồng nghiệp đã công khai bác bỏ ý tưởng của Goldman. Tại sao người dùng cần LinkedIn để tìm ra mạng của họ cho họ? Trang web đã có một trình nhập sổ địa chỉ có thể thu hút tất cả các kết nối của thành viên. Anh ấy có thể tưởng tượng rằng các tính năng mới tận dụng các kinh nghiệm mà anh ấy đang phát triển có thể cung cấp giá trị cho người dùng. Nhưng nhóm kỹ sư của LinkedIn, bị vướng vào những thách thức trong việc mở rộng quy mô trang web, dường như không quan tâm. Một số đồng nghiệp đã công khai bác bỏ ý tưởng của Goldman. Tại sao người dùng cần LinkedIn để tìm ra mạng của họ cho họ? Trang web đã có một trình nhập sổ địa chỉ có thể thu hút tất cả các kết nối của thành viên. Anh ấy có thể tưởng tượng rằng các tính năng mới tận dụng các kinh nghiệm mà anh ấy đang phát triển có thể cung cấp giá trị cho người dùng. Nhưng nhóm kỹ sư của LinkedIn, bị vướng vào những thách thức trong việc mở rộng quy mô trang web, dường như không quan tâm. Một số đồng nghiệp đã công khai bác bỏ ý tưởng của Goldman. Tại sao người dùng cần LinkedIn để tìm ra mạng của họ cho họ? Trang web đã có một trình nhập sổ địa chỉ có thể thu hút tất cả các kết nối của thành viên.
May mắn thay, Reid Hoffman, người đồng sáng lập kiêm Giám đốc điều hành của LinkedIn vào thời điểm đó (hiện là chủ tịch điều hành của nó), đã tin tưởng vào sức mạnh của phân tích vì những kinh nghiệm của ông tại PayPal và ông đã cấp cho Goldman quyền tự chủ cao. Thứ nhất, ông đã cho Goldman một cách để phá vỡ chu kỳ phát hành sản phẩm truyền thống bằng cách xuất bản các mô-đun nhỏ dưới dạng quảng cáo trên các trang phổ biến nhất của trang web.
Thông qua một mô-đun như vậy, Goldman bắt đầu kiểm tra điều gì sẽ xảy ra nếu bạn giới thiệu cho người dùng tên của những người họ chưa kết nối nhưng dường như biết — ví dụ: những người đã chia sẻ nhiệm kỳ của họ tại trường học và nơi làm việc. Anh ấy đã làm điều này bằng cách tạo ra một quảng cáo tùy chỉnh hiển thị ba kết quả phù hợp mới nhất cho mỗi người dùng dựa trên nền được nhập trong hồ sơ LinkedIn của họ. Trong vòng vài ngày, rõ ràng là một điều gì đó đáng chú ý đã xảy ra. Tỷ lệ nhấp vào những quảng cáo đó là cao nhất từng thấy. Goldman tiếp tục tinh chỉnh cách tạo ra các đề xuất, kết hợp các ý tưởng mạng như “kết thúc tam giác” - quan điểm rằng nếu bạn biết Larry và Sue, rất có thể Larry và Sue biết nhau. Goldman và nhóm của anh ấy cũng có hành động cần thiết để phản hồi một đề xuất chỉ với một cú nhấp chuột.
Sự thiếu hụt các nhà khoa học dữ liệu đang trở thành một hạn chế nghiêm trọng trong một số lĩnh vực.
Không mất nhiều thời gian để các nhà quản lý hàng đầu của LinkedIn nhận ra một ý tưởng hay và biến nó thành một tính năng tiêu chuẩn. Đó là khi mọi thứ thực sự cất cánh. Quảng cáo "Những người bạn có thể biết" đã đạt được tỷ lệ nhấp cao hơn 30% so với tỷ lệ nhận được bởi các lời nhắc khác để truy cập nhiều trang hơn trên trang web. Họ đã tạo ra hàng triệu lượt xem trang mới. Nhờ một tính năng này, quỹ đạo tăng trưởng của LinkedIn đã dịch chuyển lên đáng kể.
Một giống mới
Goldman là một ví dụ điển hình về một nhân tố quan trọng mới trong các tổ chức: “nhà khoa học dữ liệu”. Đó là một chuyên gia cấp cao được đào tạo và tò mò muốn khám phá thế giới dữ liệu lớn. Tựa game này mới xuất hiện được vài năm. (Nó được đặt ra vào năm 2008 bởi một người trong chúng tôi, DJ Patil và Jeff Hammerbacher, sau đó là những người đứng đầu các nỗ lực phân tích và dữ liệu tương ứng tại LinkedIn và Facebook.) các công ty. Sự xuất hiện bất ngờ của họ trên thị trường kinh doanh phản ánh một thực tế là các công ty hiện đang vật lộn với thông tin về chủng loại và số lượng chưa từng gặp trước đây. Nếu tổ chức của bạn lưu trữ nhiều petabyte dữ liệu, nếu thông tin quan trọng nhất đối với doanh nghiệp của bạn nằm ở các dạng khác với hàng và cột số,
Phần lớn sự nhiệt tình hiện tại đối với dữ liệu lớn tập trung vào các công nghệ giúp bạn thuần hóa nó, bao gồm Hadoop (khuôn khổ được sử dụng rộng rãi nhất để xử lý hệ thống tệp phân tán) và các công cụ mã nguồn mở liên quan, điện toán đám mây và trực quan hóa dữ liệu. Trong khi đó là những bước đột phá quan trọng, ít nhất cũng quan trọng là những người có bộ kỹ năng (và tư duy) để sử dụng chúng một cách hiệu quả. Ở khía cạnh này, nhu cầu đã chạy trước nguồn cung. Thật vậy, sự thiếu hụt các nhà khoa học dữ liệu đang trở thành một hạn chế nghiêm trọng trong một số lĩnh vực. Greylock Partners, một công ty liên doanh giai đoạn đầu đã hỗ trợ các công ty như Facebook, LinkedIn, Palo Alto Networks và Workday, đủ lo lắng về nguồn lao động eo hẹp mà họ đã xây dựng đội ngũ tuyển dụng chuyên biệt của riêng mình để tạo nguồn nhân lực cho các doanh nghiệp. danh mục đầu tư. “Sau khi họ có dữ liệu,
Những người này là ai?
Nếu việc tận dụng dữ liệu lớn phụ thuộc vào việc thuê các nhà khoa học dữ liệu khan hiếm, thì thách thức đối với các nhà quản lý là học cách xác định tài năng đó, thu hút tài năng đó vào doanh nghiệp và làm cho nó hoạt động hiệu quả. Không có nhiệm vụ nào trong số đó đơn giản như với các vai trò tổ chức đã được thiết lập khác. Bắt đầu với thực tế là không có chương trình đại học nào cấp bằng về khoa học dữ liệu. Cũng có rất ít sự đồng thuận về vị trí phù hợp với vai trò trong một tổ chức, cách các nhà khoa học dữ liệu có thể thêm giá trị cao nhất và cách đo lường hiệu suất của họ.
Do đó, bước đầu tiên để đáp ứng nhu cầu của các nhà khoa học dữ liệu là hiểu những gì họ làm trong các doanh nghiệp. Sau đó hỏi, họ cần những kỹ năng gì? Và những kỹ năng đó dễ tìm thấy nhất trong những lĩnh vực nào?
Hơn bất cứ điều gì, những gì các nhà khoa học dữ liệu làm là tạo ra những khám phá trong khi bơi trong dữ liệu. Đó là phương pháp ưa thích của họ để điều hướng thế giới xung quanh. Thoải mái trong lĩnh vực kỹ thuật số, họ có thể mang lại cấu trúc cho một lượng lớn dữ liệu vô dạng và thực hiện phân tích. Họ xác định các nguồn dữ liệu phong phú, kết hợp chúng với các nguồn dữ liệu khác, có khả năng không đầy đủ và làm sạch tập hợp kết quả. Trong bối cảnh cạnh tranh, nơi các thách thức liên tục thay đổi và dữ liệu không ngừng chảy, các nhà khoa học dữ liệu giúp các nhà ra quyết định chuyển từ phân tích đặc biệt sang cuộc trò chuyện liên tục với dữ liệu.
Các nhà khoa học dữ liệu nhận ra rằng họ phải đối mặt với những hạn chế về kỹ thuật, nhưng họ không cho phép điều đó làm chùn bước tìm kiếm các giải pháp mới. Khi họ khám phá, họ truyền đạt những gì họ đã học được và đề xuất ý nghĩa của nó đối với các hướng kinh doanh mới. Họ thường sáng tạo trong việc hiển thị thông tin một cách trực quan và làm cho các mẫu mà họ thấy rõ ràng và hấp dẫn. Họ tư vấn cho giám đốc điều hành và giám đốc sản phẩm về tác động của dữ liệu đối với sản phẩm, quy trình và quyết định.
Với tình trạng thương mại sơ khai của họ, các nhà khoa học dữ liệu thường phải trang bị các công cụ của riêng họ và thậm chí tiến hành nghiên cứu theo phong cách hàn lâm. Yahoo, một trong những công ty đã tuyển dụng một nhóm các nhà khoa học dữ liệu từ rất sớm, là công cụ trong việc phát triển Hadoop. Nhóm dữ liệu của Facebook đã tạo ra ngôn ngữ Hive để lập trình các dự án Hadoop. Nhiều nhà khoa học dữ liệu khác, đặc biệt là tại các công ty định hướng dữ liệu như Google, Amazon, Microsoft, Walmart, eBay, LinkedIn và Twitter, đã bổ sung và cải tiến bộ công cụ này.
Loại người nào làm tất cả những điều này? Những khả năng nào làm nên thành công của một nhà khoa học dữ liệu? Hãy nghĩ về anh ấy hoặc cô ấy như một sự kết hợp giữa hacker dữ liệu, nhà phân tích, nhà giao tiếp và cố vấn đáng tin cậy. Sự kết hợp này cực kỳ mạnh mẽ - và hiếm.
ĐỌC THÊM
TÍNH NĂNG CHIẾN LƯỢC CẠNH TRANH
- Andrew McAfee và Erik Brynjolfsson
Những thách thức của việc trở thành một tổ chức hỗ trợ dữ liệu lớn đòi hỏi sự lãnh đạo của thực hành — hoặc trong một số trường hợp — lãnh đạo.
Kỹ năng phổ biến và cơ bản nhất của các nhà khoa học dữ liệu là khả năng viết mã. Điều này có thể ít đúng hơn trong thời gian 5 năm nữa, khi nhiều người hơn sẽ có danh hiệu “nhà khoa học dữ liệu” trên danh thiếp của họ. Các nhà khoa học dữ liệu sẽ cần phải giao tiếp bằng ngôn ngữ lâu dài hơn mà tất cả các bên liên quan của họ đều hiểu — và thể hiện các kỹ năng đặc biệt liên quan đến việc kể chuyện bằng dữ liệu, cho dù bằng lời nói, bằng hình ảnh hay — lý tưởng — cả hai.
Nhưng chúng tôi có thể nói rằng đặc điểm nổi trội của các nhà khoa học dữ liệu là sự tò mò mãnh liệt — mong muốn đi sâu vào bên dưới bề mặt của một vấn đề, tìm ra các câu hỏi trọng tâm của nó và chắt lọc chúng thành một bộ giả thuyết rất rõ ràng có thể được kiểm tra. Điều này thường kéo theo tư duy liên kết đặc trưng của các nhà khoa học sáng tạo nhất trong bất kỳ lĩnh vực nào. Ví dụ, chúng ta biết về một nhà khoa học dữ liệu đang nghiên cứu một vấn đề gian lận, người đã nhận ra rằng nó tương tự như một loại vấn đề giải trình tự DNA. Bằng cách tập hợp những thế giới khác nhau đó lại với nhau, anh ấy và nhóm của mình đã có thể tạo ra một giải pháp giúp giảm đáng kể tổn thất do gian lận.
Có lẽ đã trở nên rõ ràng tại sao từ “nhà khoa học” phù hợp với vai trò mới nổi này. Ví dụ, các nhà vật lý thực nghiệm cũng phải thiết kế thiết bị, thu thập dữ liệu, tiến hành nhiều thí nghiệm và truyền đạt kết quả của họ. Do đó, các công ty tìm kiếm những người có thể làm việc với dữ liệu phức tạp đã may mắn tuyển dụng được những người có trình độ học vấn và làm việc trong lĩnh vực khoa học vật lý hoặc xã hội. Một số nhà khoa học dữ liệu giỏi nhất và sáng giá nhất là tiến sĩ trong các lĩnh vực bí truyền như sinh thái học và sinh học hệ thống. George Roumeliotis, trưởng nhóm khoa học dữ liệu tại Intuit ở Thung lũng Silicon, có bằng tiến sĩ vật lý thiên văn. Ít ngạc nhiên hơn một chút, nhiều nhà khoa học dữ liệu làm việc trong lĩnh vực kinh doanh ngày nay được đào tạo chính quy về khoa học máy tính, toán học hoặc kinh tế. Chúng có thể xuất hiện từ bất kỳ lĩnh vực nào có trọng tâm về dữ liệu và tính toán mạnh mẽ.
Điều quan trọng là phải ghi nhớ hình ảnh đó của nhà khoa học — bởi vì từ “dữ liệu” có thể dễ dàng đưa việc tìm kiếm nhân tài đi sai đường. Như Portillo đã nói với chúng tôi, "Nền tảng truyền thống của những người bạn đã thấy cách đây 10 đến 15 năm nhưng đừng cắt bỏ nó vào những ngày này." Một nhà phân tích định lượng có thể rất giỏi trong việc phân tích dữ liệu nhưng không thể phân tích một khối lượng lớn dữ liệu phi cấu trúc và đưa nó vào một dạng mà nó có thể được phân tích. Một chuyên gia quản lý dữ liệu có thể giỏi trong việc tạo và tổ chức dữ liệu ở dạng có cấu trúc nhưng không giỏi biến dữ liệu phi cấu trúc thành dữ liệu có cấu trúc — và cũng không thực sự phân tích dữ liệu. Và trong khi những người không có kỹ năng xã hội vững vàng có thể phát triển mạnh trong các nghề dữ liệu truyền thống, thì các nhà khoa học dữ liệu phải có những kỹ năng như vậy để hoạt động hiệu quả.
Cách tìm nhà khoa học dữ liệu bạn cần
1. Tập trung tuyển dụng tại các trường đại học “thường bị nghi ngờ” (Stanford, MIT, Berkeley, Harvard, Carnegie Mellon) và cả tại ...
Roumeliotis đã nói rõ với chúng tôi rằng anh ấy không thuê dựa trên khả năng thống kê hoặc phân tích. Anh bắt đầu tìm kiếm các nhà khoa học dữ liệu bằng cách hỏi các ứng viên xem họ có thể phát triển các nguyên mẫu bằng một ngôn ngữ lập trình chính thống như Java hay không. Roumeliotis tìm kiếm cả một bộ kỹ năng — một nền tảng vững chắc về toán học, thống kê, xác suất và khoa học máy tính — và một số thói quen trong tâm trí. Anh ấy muốn những người có cảm giác với các vấn đề kinh doanh và đồng cảm với khách hàng. Sau đó, anh ấy nói, anh ấy xây dựng dựa trên tất cả những điều đó với đào tạo tại chỗ và thỉnh thoảng tham gia một khóa học về một công nghệ cụ thể.
Một số trường đại học đang có kế hoạch triển khai các chương trình khoa học dữ liệu và các chương trình hiện có về phân tích, chẳng hạn như chương trình Thạc sĩ Khoa học về Analytics tại Bang North Carolina, đang bận rộn bổ sung các bài tập về dữ liệu lớn và các môn học. Một số công ty cũng đang cố gắng phát triển các nhà khoa học dữ liệu của riêng họ. Sau khi mua lại công ty dữ liệu lớn Greenplum, EMC quyết định rằng sự sẵn có của các nhà khoa học dữ liệu sẽ là một yếu tố quan trọng trong việc khai thác dữ liệu lớn của chính họ - và của khách hàng -. Vì vậy, bộ phận Dịch vụ Giáo dục của họ đã khởi động một chương trình đào tạo và cấp chứng chỉ về khoa học dữ liệu và phân tích dữ liệu lớn. EMC cung cấp chương trình cho cả nhân viên và khách hàng, và một số sinh viên tốt nghiệp của nó đã và đang làm việc với các sáng kiến dữ liệu lớn nội bộ.
Các nhà khoa học dữ liệu muốn xây dựng mọi thứ chứ không chỉ đưa ra lời khuyên. Một người mô tả việc trở thành một nhà tư vấn là “vùng chết”.
Khi các dịch vụ giáo dục sinh sôi nảy nở, nguồn tài năng sẽ mở rộng. Các nhà cung cấp công nghệ dữ liệu lớn cũng đang nỗ lực để làm cho chúng dễ sử dụng hơn. Trong khi đó, một nhà khoa học dữ liệu đã đưa ra một cách tiếp cận sáng tạo để thu hẹp khoảng cách. Chương trình Nghiên cứu sinh Khoa học Dữ liệu Insight, một học bổng sau tiến sĩ được thiết kế bởi Jake Klamka (một nhà vật lý năng lượng cao được đào tạo), nhận các nhà khoa học từ các học viện và trong sáu tuần chuẩn bị cho họ thành công với tư cách là nhà khoa học dữ liệu. Chương trình kết hợp sự cố vấn của các chuyên gia dữ liệu từ các công ty địa phương (chẳng hạn như Facebook, Twitter, Google và LinkedIn) với việc tiếp xúc với những thách thức dữ liệu lớn thực tế. Ban đầu nhắm đến mục tiêu 10 nghiên cứu sinh, Klamka đã chấp nhận 30, từ một nhóm ứng viên có số lượng hơn 200. Nhiều tổ chức hiện đang xếp hàng để tham gia. “Nhu cầu từ các công ty là một hiện tượng, ”Klamka nói với chúng tôi. "Họ chỉ không thể có được loại tài năng chất lượng cao này."
Tại sao một nhà khoa học dữ liệu lại muốn làm việc ở đây?
Ngay cả khi hàng ngũ các nhà khoa học dữ liệu tăng lên, sự cạnh tranh cho các tài năng hàng đầu sẽ vẫn khốc liệt. Mong đợi các ứng viên mở rộng quy mô cơ hội việc làm dựa trên mức độ thú vị của các thách thức dữ liệu lớn. Như một trong số họ đã nhận xét, "Nếu chúng tôi muốn làm việc với dữ liệu có cấu trúc, chúng tôi sẽ ở Phố Wall." Do những khách hàng tiềm năng đủ điều kiện nhất hiện nay đến từ các nền tảng phi kinh doanh, các nhà quản lý tuyển dụng có thể cần phải tìm ra cách vẽ nên một bức tranh thú vị về tiềm năng đột phá mà các vấn đề của họ mang lại.
Tất nhiên, trả tiền sẽ là một yếu tố. Một nhà khoa học dữ liệu giỏi sẽ có nhiều cánh cửa mở ra cho anh ta hoặc cô ta, và tiền lương sẽ được nâng lên. Một số nhà khoa học dữ liệu làm việc tại các công ty khởi nghiệp nhận xét rằng họ đã yêu cầu và nhận được các gói quyền chọn cổ phiếu lớn. Ngay cả đối với một người nào đó chấp nhận một vị trí vì những lý do khác, sự đền bù báo hiệu một mức độ tôn trọng và giá trị mà vai trò đó dự kiến sẽ thêm vào doanh nghiệp. Nhưng cuộc khảo sát không chính thức của chúng tôi về các ưu tiên của các nhà khoa học dữ liệu đã tiết lộ một điều về cơ bản quan trọng hơn. Họ muốn “ở trên cây cầu”. Tham chiếu đến chương trình truyền hình Star Trek những năm 1960 , trong đó thuyền trưởng tàu chở sao James Kirk chủ yếu dựa vào dữ liệu do ông Spock cung cấp. Các nhà khoa học dữ liệu muốn có được bề dày của một tình huống đang phát triển, với nhận thức thời gian thực về tập hợp các lựa chọn đang phát triển mà nó đưa ra.
Xem xét khó khăn của việc tìm kiếm và lưu giữ các nhà khoa học dữ liệu, người ta sẽ nghĩ rằng một chiến lược tốt sẽ liên quan đến việc thuê họ làm tư vấn. Hầu hết các công ty tư vấn vẫn chưa tập hợp nhiều người trong số họ. Ngay cả các công ty lớn nhất, chẳng hạn như Accenture, Deloitte và IBM Global Services, đang trong giai đoạn đầu của các dự án dữ liệu lớn cho khách hàng của họ. Các kỹ năng của các nhà khoa học dữ liệu mà họ có trong đội ngũ nhân viên chủ yếu được áp dụng cho các vấn đề phân tích định lượng thông thường hơn. Các công ty dịch vụ phân tích nước ngoài, chẳng hạn như Mu Sigma, có thể là những công ty thực hiện bước thâm nhập lớn đầu tiên với các nhà khoa học dữ liệu.
Nhưng các nhà khoa học dữ liệu mà chúng tôi đã nói chuyện nói rằng họ muốn xây dựng mọi thứ chứ không chỉ đưa ra lời khuyên cho người ra quyết định. Một người đã mô tả việc trở thành một nhà tư vấn là “vùng chết - tất cả những gì bạn phải làm là nói cho người khác biết họ nên làm gì”. Bằng cách tạo ra các giải pháp hiệu quả, họ có thể có nhiều tác động hơn và để lại dấu ấn như những người tiên phong trong nghề của họ.
Chăm sóc và Cho ăn
Các nhà khoa học dữ liệu không làm tốt trong một thời gian ngắn. Họ nên có quyền tự do thử nghiệm và khám phá các khả năng. Điều đó nói lên rằng họ cần mối quan hệ chặt chẽ với phần còn lại của doanh nghiệp. Mối quan hệ quan trọng nhất để họ rèn luyện là với các giám đốc điều hành phụ trách sản phẩm và dịch vụ hơn là với những người giám sát các chức năng kinh doanh. Như câu chuyện của Jonathan Goldman đã minh họa, cơ hội lớn nhất để gia tăng giá trị của họ không phải là tạo báo cáo hoặc bài thuyết trình cho các giám đốc điều hành cấp cao mà là đổi mới với các sản phẩm và quy trình hướng tới khách hàng.
LinkedIn không phải là công ty duy nhất sử dụng các nhà khoa học dữ liệu để tạo ra ý tưởng cho các sản phẩm, tính năng và dịch vụ gia tăng giá trị. Tại Intuit, các nhà khoa học dữ liệu được yêu cầu phát triển thông tin chi tiết cho khách hàng và người tiêu dùng doanh nghiệp nhỏ, đồng thời báo cáo cho một phó chủ tịch cấp cao mới về dữ liệu lớn, thiết kế xã hội và tiếp thị. GE đã sử dụng khoa học dữ liệu để tối ưu hóa các hợp đồng dịch vụ và khoảng thời gian bảo trì cho các sản phẩm công nghiệp. Tất nhiên, Google sử dụng các nhà khoa học dữ liệu để tinh chỉnh các thuật toán tìm kiếm và phân phát quảng cáo cốt lõi của mình. Zynga sử dụng các nhà khoa học dữ liệu để tối ưu hóa trải nghiệm trò chơi cho cả mức độ tương tác lâu dài và doanh thu. Netflix đã tạo ra Giải thưởng Netflix nổi tiếng, được trao cho nhóm khoa học dữ liệu đã phát triển cách tốt nhất để cải thiện hệ thống đề xuất phim của công ty.
Các nhà khoa học dữ liệu ngày nay cũng giống như những “quants” của Phố Wall của những năm 1980 và 1990.
Tuy nhiên, có một nhược điểm tiềm ẩn là để những người có kỹ năng tinh vi trong một lĩnh vực phát triển nhanh dành thời gian cho các đồng nghiệp quản lý chung. Họ sẽ có ít tương tác hơn với các chuyên gia tương tự, điều mà họ cần giữ cho kỹ năng của mình sắc bén và bộ công cụ của họ hiện đại nhất. Các nhà khoa học dữ liệu phải kết nối với các cộng đồng thực hành, trong các công ty lớn hoặc bên ngoài. Các hội nghị mới và các hiệp hội không chính thức đang mọc lên để hỗ trợ sự hợp tác và chia sẻ công nghệ, và các công ty nên khuyến khích các nhà khoa học tham gia vào các hội nghị đó với hiểu rằng “nhiều nước hơn trong bến cảng sẽ làm trôi tất cả các tàu thuyền”.
Các nhà khoa học dữ liệu cũng có xu hướng được thúc đẩy nhiều hơn khi họ được mong đợi nhiều hơn. Những thách thức khi truy cập và cấu trúc dữ liệu lớn đôi khi để lại rất ít thời gian hoặc năng lượng cho các phân tích phức tạp liên quan đến dự đoán hoặc tối ưu hóa. Tuy nhiên, nếu các giám đốc điều hành làm rõ rằng các báo cáo đơn giản là không đủ, các nhà khoa học dữ liệu sẽ dành nhiều nỗ lực hơn cho các phân tích nâng cao. Dữ liệu lớn không nên bằng “toán học nhỏ”.
Công việc hấp dẫn của thập kỷ
Hal Varian, nhà kinh tế trưởng của Google, được biết là đã nói, “Công việc hấp dẫn trong 10 năm tới sẽ là các nhà thống kê. Mọi người nghĩ tôi đang nói đùa, nhưng ai có thể ngờ rằng kỹ sư máy tính lại là công việc hấp dẫn của những năm 1990? ”
Nếu "gợi cảm" có nghĩa là có những phẩm chất hiếm có và được nhiều người yêu cầu, thì các nhà khoa học dữ liệu đã ở đó. Họ rất khó thuê và tốn kém, và, do thị trường rất cạnh tranh cho các dịch vụ của họ, rất khó để giữ chân họ. Đơn giản là không có nhiều người có nền tảng khoa học kết hợp với các kỹ năng tính toán và phân tích của họ.
Các nhà khoa học dữ liệu ngày nay tương tự như những "quants" của Phố Wall của những năm 1980 và 1990. Vào những ngày đó, những người có kiến thức về vật lý và toán học thường đến các ngân hàng đầu tư và quỹ đầu cơ, nơi họ có thể đưa ra các thuật toán và chiến lược dữ liệu hoàn toàn mới. Sau đó, nhiều trường đại học đã phát triển các chương trình thạc sĩ về kỹ thuật tài chính, tạo ra thế hệ tài năng thứ hai dễ tiếp cận hơn với các công ty chính thống. Mô hình này được lặp lại sau đó vào những năm 1990 với các kỹ sư tìm kiếm, những người mà những kỹ năng hiếm có đã sớm được dạy trong các chương trình khoa học máy tính.
Một câu hỏi được đặt ra bởi vấn đề này là liệu một số công ty có khôn ngoan khi đợi cho đến khi thế hệ thứ hai của các nhà khoa học dữ liệu xuất hiện, và các ứng cử viên nhiều hơn, ít tốn kém hơn, và dễ dàng hơn để kiểm tra và đồng hóa trong một môi trường kinh doanh. Tại sao không để những khó khăn trong việc săn lùng và thuần hóa những tài năng kỳ lạ cho các công ty khởi nghiệp dữ liệu lớn và cho các công ty như GE và Walmart, những công ty có chiến lược quyết liệt đòi hỏi họ phải đi đầu?
Vấn đề với lý do đó là sự tiến bộ của dữ liệu lớn không có dấu hiệu chậm lại. Nếu các công ty đứng ngoài xu hướng này ngay từ những ngày đầu vì thiếu nhân tài, họ có nguy cơ bị tụt lại phía sau khi các đối thủ cạnh tranh và đối tác kênh đạt được những lợi thế gần như không có. Bây giờ, hãy coi dữ liệu lớn như một làn sóng hoành tráng, đang bắt đầu lên đỉnh. Muốn bắt được thì phải cần những người biết lướt.
Bình luận