데이터 분석과 기계 학습은 큰 발전을 이루고 있습니다. 그러나 이는 데이터 생산, 저장, 공유 및 네트워크 학습의 지속적인 진화에서 가능한 다음 인접 가능성입니다.
데이터의 진화…
- 데이터 부족 – 1990년대 초반과 그 이전에는 데이터 생산이 낮았고(오늘날에 비해) 데이터를 저장하고 공유하는 메커니즘이 더 제한적이기 때문에 데이터가 상당히 부족했습니다.
- 데이터 생산 – 2000년대는 센서의 시대가 되었습니다. 전자 장치의 발전으로 센서는 더 저렴해졌습니다. 결과적으로 센서의 생산과 새로운 센서의 다양성이 크게 증가했습니다. 방대한 규모의 센서가 배포되면서 데이터 생산이 기하급수적으로 증가했으며 계속해서 증가하고 있습니다.
- 데이터 저장소 – 데이터 생산이 급증하면서 비용 효율적인 데이터 저장에 대한 필요성이 높아졌습니다. 규모에 따라 데이터 스토리지는 이제 매우 저렴해져서 데이터 크기가 엄청날 때까지 거의 무시할 수 있는 비용에 도달합니다.
- 데이터 공유 – 1990년대에는 기업이 자체적으로 내부 데이터를 생성했지만, 대부분 기업 외부에 공유되지 않았습니다. 인쇄된 형태를 제외하고는 일반적인 지식도 없었습니다. 인터넷의 출현과 그 이후의 광범위한 채택(1993년 이상)으로 데이터 공유는 그 어느 때보다 널리 보급되었지만(특히 API의 확산으로) 대부분 구조화되지 않은 상태로 남아 있었습니다.
- 데이터 구조화 – 기술에 정통한 업계 전문가는 사용 가능한 정보 세트 내에서 반복 가능한 패턴을 보고 한 번에 하나의 산업 수직으로 구조화하기 시작했습니다. 수집 및 분류는 다음으로 "인접한 가능"이었습니다(2004년 – 2016년경). 이것이 사실 PrivateEquityInfo.com이 2004년에 시작된 방법입니다. 저는 사모 펀드 및 관련 M&A 회사 및 이벤트 전반에 걸쳐 데이터를 구조화할 기회를 확인했습니다. 이를 통해 사람들은 정보 검색 및 전문 네트워킹에 소요되는 엄청난 시간을 절약하고 M&A 거래의 효율성을 높일 수 있었습니다.
- 데이터 분석 – 구조화된 데이터를 통해 이제 알고리즘을 통해 전례 없이 시간 경과에 따른 데이터의 추세를 분석하고 발견할 수 있는 기능을 갖게 되었습니다. 이것은 우리가 역사적 맥락을 더 잘 이해하는 데 도움이 되었고 역사적 추세로부터 미래 예측을 가능하게 했습니다(2008+). 또한 적어도 방향성 있는 실행 가능한 통찰력을 제공합니다.
- 빅데이터 – 데이터가 의사 결정에 점점 더 유용해짐에 따라 점점 더 많은 데이터를 수집하기 시작했습니다. 데이터(및 충분한 처리 능력)가 있으면 많을수록 좋습니다(데이터 확장으로 인해 데이터 품질이 저하되지 않는다는 가정… 종종 잘못된 가정).
- 스마트 데이터 및 기계 학습 – 센서 및 다양한 입력에서 구조화된 데이터 수집이 이를 따라잡는 우리의 (인간) 능력을 크게 앞지르기 시작하면서 우리는 머신 러닝 기술을 사용하여 데이터 내에서 관계를 설정하고 더 나은 미래 예측 및 지표를 만들기 시작했습니다. 대량의 데이터가 제공되는 머신 러닝은 사람이 코딩한 알고리즘보다 훨씬 강력합니다. 방대한 양의 데이터에서 기계는 인간이 할 수 없는 패턴을 찾아낼 수 있습니다. 그들은 더 빨리 학습하고 데이터에서 인과 관계를 찾아내어 인간보다 더 정확하게 결과를 예측할 수 있습니다. 수많은 데이터와 결합된 스마트한 기계 학습 데이터 기반 알고리즘은 이제 인공 지능(2015+)에 가까운 지능을 제공합니다.
다음은 무엇입니까?
네트워크 학습 – 2018년 이상에는 기계가 데이터를 생성하고 미리 결정되고 구조화된 형식으로 제공하며 이 데이터를 다른 기계와 공유하고 기계 네트워크가 서로 학습하도록 합니다. 기계의 초지능. 더 많은 처리 능력, 더 많은 저장 용량 및 더 빠른 정보 검색을 제외하고 인간 두뇌의 복잡한 네트워크를 더 밀접하게 모델링합니다. 이것은 특이점은 아니지만 기계가 생성하는 지능이 그렇게 인공적으로 느껴지지 않을 정도로 엄청난 도약이 될 것입니다.