회귀 분석을 사용한 부동산 가치 평가 – 튜토리얼

실행 요약

회귀 분석은 부동산 가치 평가에 대한 보다 과학적인 접근 방식을 제공합니다.
  • 전통적으로 자산 평가에는 비교 가능한 판매, 수입 및 비용의 세 가지 접근 방식이 있습니다.
  • 회귀 모델은 보다 유연하고 객관적인 대안을 제공합니다. 또한 모델이 만들어지면 자율적으로 되어 부동산 기업가가 핵심 역량에 집중할 수 있는 프로세스이기도 합니다.
  • 평방피트 및 침실 수와 같이 부동산 가치에 미치는 영향을 테스트하는 수많은 변수를 사용하여 모델을 만들 수 있습니다.
  • 회귀는 마법의 총알이 아닙니다. 변수에 자기상관 및/또는 다중공선성이 포함되거나 변수 간의 상관관계가 가짜일 위험이 항상 있습니다.
예:펜실베니아주 앨러게니 카운티에 대한 회귀 평가 모델 구축
  • 모델에 입력하기 위해 전자적으로 액세스할 수 있는 부동산 정보가 너무 많습니다. 정부 기관, 전문 데이터 제공업체 및 다중 목록 서비스가 이러한 소스입니다.
  • 초기 데이터 덤프에는 불규칙한 정보 집합이 없는지 확인하기 위해 약간의 정리가 필요합니다. 예를 들어, 우리 샘플에서는 공정한 시장 가치의 결과를 왜곡하지 않기 위해 선물로 양도된 주택을 제거했습니다.
  • 데이터의 10%에서 무작위 샘플을 사용하여 SPSS는 부동산 가치를 가장 잘 예측할 수 있는 다음 5가지 변수를 반환했습니다.
    • 1-19 등급의 시공 품질에 따른 등급(1=매우 나쁨 및 19=우수)
    • 완성된 거실 공간
    • 에어컨(예/아니오)
    • 로트 크기
    • 신체 상태 또는 수리 상태에 대한 등급은 1-8등급
  • 자기 상관에 대해 Durbin-Watson 테스트를 사용하고 이분산성에 대해 Breusch-Pagan 테스트를 사용하여 결과를 테스트하는 것이 중요합니다. 우리 모델에는 약간의 이분산 경향이 있었는데, 이는 일부 변수의 변동성이 전체 값 범위에서 동일하지 않음을 나타냅니다.
회귀 기반 부동산 분석이 귀하의 비즈니스에 유용할 수 있습니까?
  • 부동산 가치 평가 외에도 부동산 내 회귀 분석은 다른 영역에서 특히 유용할 수 있습니다.
    • 과거 거래에 대한 수익 실적 테스트
    • 정가 및 임대료에 대한 가격 분석
    • 주택 구매자 및 세입자에 대한 인구통계학적 및 심리분석
    • 직접 마케팅 대상 파악
    • 마케팅 캠페인을 위한 ROI 분석
  • 또한 회귀 모델을 구축할 후보자를 평가할 때 처음부터 세상을 약속하는 사람들을 조심하십시오. 강력한 회귀 모델을 구축하는 것은 반복적인 프로세스이므로, 대신 자연스럽게 호기심이 많고 그 자리에서 생각할 수 있는(즉, 사고 프로세스로 브레인티저에 답변할 수 있는) 사람들에게 집중하세요.

부동산에서 너무 자주 가치 평가 과정은 엄지손가락을 빠는 행위로 보일 수 있습니다. 부동산 중개인이 와서 속담을 걷어차고 "정량적"인 통찰력이 거의 없는 추정 가치를 산출할 것입니다. 많은 사람들에게 집은 일생에 걸쳐 가장 큰 재정적 투자가 될 것이라는 점을 감안할 때 재산 소유가 가져오는 정서적 애착 때문에 그 과정이 더 악화될 수 있습니다.

그러나 이 광기에 대한 방법이 있습니다. 정확히는 3개입니다.

재산 가치는 어떻게 평가됩니까?

비교 가능한 판매 접근 방식은 주거용 부동산에서 가장 일반적이며 유사한 자산의 최근 판매를 사용하여 대상 자산의 가치를 결정합니다. "comp"의 판매 가격은 대상 부동산과의 차이에 따라 조정됩니다. 예를 들어, 비교 가능한 속성에 추가 욕실이 있는 경우 관찰된 판매 가격에서 욕실의 예상 가치를 뺍니다.

상업용 부동산은 더 이질적인 것으로 간주되므로 비교 가능한 판매 접근 방식은 덜 자주 사용됩니다. 자산의 내재 가치가 할인된 모든 현금 흐름의 합과 같다는 개념에 기반한 소득 접근 방식은 일반적으로 두 가지 방법에 걸쳐 적용됩니다.

  1. 연금의 현재 가치와 유사하게 직접 자본화 방법은 자산의 순영업소득(NOI)을 "캡 레이트"로 나누어 가치를 설정합니다. cap rate에는 내재할인율과 순영업이익의 미래성장률이 포함됩니다.
  2. 할인 현금 흐름법은 일정 기간 동안의 미래 현금 흐름의 현재 가치를 최종 캡 레이트를 사용하여 추정한 최종 가치와 함께 제공합니다.

마지막 기술은 동일한 토지를 취득하고 대상 부동산의 복제본을 구축하는 비용을 기반으로 가치를 추정하는 비용 접근 방식입니다. 그런 다음 프로젝트 비용은 대상 자산의 현재 노후화 상태에 따라 감가상각됩니다. 비교 가능한 판매 접근 방식의 조정과 유사하게 목표는 대상 자산과 밀접하게 일치하는 것입니다. 비용 접근 방식은 다른 두 접근 방식보다 덜 자주 사용됩니다.

모든 전통적인 부동산 평가 방법은 평가에 사용되는 입력의 선택으로 인해 주관적입니다. 예를 들어, 캡 레이트의 선택은 자산 가치 평가에 상당한 영향을 미칩니다. NOI가 $1M인 자산의 가치를 평가할 때 캡 레이트가 4% 증가하면(6%에서 10%로) 자산 가치가 감소합니다. 재산 40%(아래 차트).

부동산 가치 평가에서 회귀 모델 사용의 이점

부동산 평가에 회귀 모델을 사용하면 많은 이점이 있습니다. 소매 산업은 부지 선정을 위한 사용을 수용했지만 부동산 산업은 대부분 잠재적인 이점을 간과했습니다. 회귀 분석은 특히 많은 양의 데이터를 분석하는 데 적합합니다. 해당 국가의 모든 지역 부동산 시장에 대한 강력한 지식을 갖추는 것은 사실상 불가능하지만 회귀 모델링은 검색 범위를 좁히는 데 도움이 될 수 있습니다.

1. 유연성

회귀 모델링 사용의 가장 큰 이점은 고유한 유연성입니다. 다른 모델과 독립적으로 또는 함께 작동할 수 있습니다.

가장 직접적인 접근 방식은 기존 판매 데이터를 사용하여 대상 자산의 가치를 모델의 출력으로 예측하는 것입니다. 개인 데이터 제공업체를 통해 보완할 수 있는 지역, 주 및 연방 기관의 다양한 무료 데이터 소스가 있습니다.

또 다른 옵션은 회귀 모델을 사용하여 다른 전통적인 평가 방법에 대한 입력을 보다 정확하게 예측하는 것입니다. 예를 들어, 복합 용도 상업 프로젝트를 분석할 때 개발자는 소매 공간의 평방 피트당 판매를 예측하는 모델과 주거용 구성 요소의 임대료를 예측하는 다른 모델을 만들 수 있습니다. 그러면 이 두 가지 모두 가치 평가를 위한 소득 접근 방식에 대한 입력으로 사용될 수 있습니다.

2. 객관적인 접근

건전한 통계 원칙을 사용하면 평가에 대한 보다 객관적인 접근 방식을 얻을 수 있습니다. 이는 사람들이 기존 의견을 확인하는 정보를 찾거나 그에 반하는 새로운 정보를 거부할 때 발생하는 확인 편향을 피하는 가장 좋은 방법 중 하나입니다. 내가 소매업체를 위한 모델을 구축하여 신규 매장 판매를 예측할 때, 그들은 많은 소매업체가 경쟁업체와 가까워짐에 따라 이익을 얻는다는 사실을 알고 종종 놀랐습니다. 사실, 종종 가장 큰 경쟁자인 Walmart와의 코로케이션은 내 모델에서 사용되는 가장 일반적인 변수 중 하나였습니다. 기존의 편견에 의존하면 기회를 놓칠 수 있으며 더 나아가 모퉁이에 재앙을 숨길 수도 있습니다.

통계적 평가의 객관적인 이점은 다음과 같습니다.

  1. 통계 분석을 통해 모델에 있는 개별 요인의 통계적 유의성(신뢰성)을 결정할 수 있습니다.
  2. 시나리오 또는 민감도 분석은 보다 전통적인 방법의 입력 변경에 대한 일반적인 아이디어를 제공할 수 있지만 원래 예측의 정확성에 대한 더 나은 아이디어를 제공하기보다는 다중 예측을 하는 것과 비슷합니다. 반면에 회귀 모델을 구축할 때 특정 신뢰 수준에 따라 결과 범위가 어떻게 되는지 알 수 있습니다.

회귀 모델은 정확도에 대한 기본 제공 검사가 있다는 점에서 고유합니다. 전체 모집단의 표본에 대한 모델을 구축한 후 표본 외 데이터에 대한 모델을 사용하여 가능한 표본 추출 편향을 감지할 수 있습니다.

3. 핵심 역량 고수

전통적인 평가 방법은 모두 선택 편향의 상당한 위험이 있습니다. 비교 가능한 속성을 선택할 때 최상의 결과를 선택하고 프로젝트와 가장 유사하다고 가정하는 함정에 빠지기 쉽습니다. 소득 접근 방식의 수익률과 같은 예측 변수도 강조됩니다. 이러한 예측의 필요성을 제거하는 것은 많은 부동산 투자자에게 매력적일 수 있으며, 이것이 회귀 기반 평가가 유용한 접근 방식인 이유입니다.

회귀 분석의 잠재적 문제

구성된 통계의 다양한 비율을 인용하는 농담의 양은 실제로 그 자체로 농담입니다. 우리는 거의 매일 새로운 연구 결과에 대한 언론 헤드라인의 폭격을 받고 있으며, 그 중 상당수는 작년에 발표된 연구와 모순되는 것 같습니다. 소리의 세계에서 연구자들이 사용하는 방법의 엄격함을 논할 시간이 없습니다.

회귀 분석에는 여러 유형이 있지만 가장 일반적인 것은 선형 회귀입니다. 모델이 유효한 것으로 간주하기 위해 위반되어서는 안 되는 선형 회귀에 대한 특정 가정이 있습니다. 이러한 가정을 위반하면 입력 및 전체 모델의 예측력을 계산하는 통계 테스트가 왜곡됩니다.

선형 회귀 가정

입력(독립 변수)과 출력(종속 변수) 사이에는 선형 관계가 있어야 합니다. 예를 들어, 가정의 난방 제곱피트와 전체 가치 사이에 선형 관계가 있다고 가정할 수 있습니다. 그러나 수익 감소로 인해 관계가 비선형적이며 원시 데이터의 변환이 필요하다는 것을 발견할 수 있었습니다.

독립 변수는 무작위가 아니어야 합니다. 간단히 말해서, 모형의 각 독립변수에 대한 관측치는 고정되어 있고 측정에 오류가 없다고 가정합니다. 예를 들어 단위 수를 사용하여 아파트 건물의 가치를 모델링하는 경우 샘플 데이터의 모든 건물에는 모델을 구축하는 방법에 관계없이 변경되지 않는 고정된 수의 단위가 있습니다.

모델의 "잔차"(즉, 모델의 예측 결과와 실제 관측치의 차이)는 합이 0이거나 더 간단한 용어로:우리가 사용할 모델은 가장 잘 맞는 선을 나타냅니다.

모델은 각 독립 변수에 대한 모든 관측치에 대해 정확해야 합니다. 면적을 기준으로 주택의 가치를 예측했다면 1,500평방피트 미만 주택의 가치를 예측하는 데 매우 정확하다면 모델을 사용하고 싶지 않지만 3,000평방피트 이상 주택에는 많은 오류가 있었습니다. 평방 피트. 이것을 이분산성이라고 합니다.

부동산 산업을 볼 때 선형 회귀의 가장 일반적인 문제 중 하나는 관측치 간의 잔차 오차의 상관 관계입니다. 패턴이 없는 백색소음이라고 생각하시면 됩니다. 그러나 잔차에 패턴이 있는 경우에는 조정이 필요할 가능성이 큽니다. 이 문제는 개념화하기 어렵지만 부동산 업계에서 이것이 우려되는 두 가지 주요 영역이 있습니다.

1. 자기상관

장기간에 걸친 관찰을 기반으로 모델을 구축하는 것은 현재 값을 예측하는 데 적합하지 않습니다. 평균 객실 요금을 독립 변수로 사용하여 호텔 속성의 가치를 예측하는 모델을 구축했다고 가정합니다. 이 변수의 예측력은 객실 요금이 시간이 지남에 따라 지속적으로 상승했기 때문에 오해의 소지가 있을 수 있습니다. 통계적 용어로, 모델에서 설명되지 않는 시간 경과에 따른 양의 추세(즉, 인플레이션)를 나타내는 관찰된 평균 객실 요금 사이의 자기 상관이 있습니다. 주거용 부동산에서 가장 널리 사용되는 기존의 비교 가능한 판매 방식은 가장 최근의 데이터만 사용하여 이 문제를 해결합니다. 상업 거래의 수가 훨씬 적기 때문에 이 시간 제한은 종종 비교 가능한 판매 접근 방식을 비효율적으로 만듭니다. 그러나 자기상관의 문제를 극복할 수 있는 선형회귀를 사용하는 기술이 있습니다.

클러스터 효과는 부동산 평가 모델링에서 중요한 과제이기도 합니다. 이것은 공간적 자기상관으로 생각할 수 있습니다. 이 문제를 생각하는 가장 간단한 방법은 고속도로 양쪽에 있는 두 지역(A와 B)의 주택 가치를 예측하는 모델을 구축하는 것을 상상하는 것입니다. 전체적으로 모델은 값을 예측하는 데 잘 작동할 수 있지만 잔차 오류를 조사할 때 패턴이 있음을 알 수 있습니다. A동의 주택은 일반적으로 약 10% 고평가되어 있고 B동의 주택은 약 10% 저평가되어 있습니다. 모델을 개선하려면 이 클러스터 효과를 설명하거나 각 이웃에 대해 하나의 모델을 구축해야 합니다.

2. 다중 공선성

이상적으로는 모델 내의 변수가 서로 상관되지 않습니다. 이 알려진 문제를 다중 공선성이라고 합니다. 지역 쇼핑몰을 평가하는 모델에 대한 입력으로 평방 피트와 주차 공간 수를 모두 사용하면 다중 공선성을 나타낼 수 있습니다. 계획 코드에는 상업 공간의 평방 피트를 기준으로 특정 수의 주차 공간이 필요한 경우가 많기 때문에 이는 직관적입니다. 이 예에서 변수 중 하나를 제거하면 예측력을 크게 줄이지 않고도 조정된 모델을 보다 정확하게 평가할 수 있습니다.

기타 고려사항

관찰된 데이터를 사용하는 것은 모든 경험적 접근의 핵심이지만 과거 결과가 항상 미래를 예측하는 것은 아니라는 점을 기억하는 것이 중요합니다. 부동산과 같은 비유동 자산은 특히 경기 순환의 변화에 ​​취약합니다. 특정 변수에 대한 예측력은 현재 경제 상황에 따라 변경될 수 있습니다. 이 문제는 선형 회귀에만 국한되지 않으며 기존 접근 방식에서도 발견됩니다.

상관관계는 인과관계와 같지 않습니다. 모델 구축의 목적은 유효한 예측을 할 수 있는 유용한 변수를 찾는 것입니다. 가짜 상관 관계를 조심해야 합니다. 메인주의 이혼율과 1인당 마가린 소비량 사이에 매우 강한 상관관계가 있다는 사실을 알고 놀라실 수도 있습니다. 그러나 미래의 마가린 판매를 예측하려는 경우 Maine의 이혼 데이터를 사용하는 것은 의미가 없습니다.

회귀를 통한 부동산 가치 평가의 실제 예

이제 이 지식을 실제로 적용하고 처음부터 끝까지 선형 모델을 구축해 보겠습니다. 예를 들어 펜실베니아 주 앨러가니 카운티에 있는 단독 주택의 가치를 예측하는 부동산 평가 모델을 구축하려고 합니다. Alleghany 카운티의 선택은 임의적이며 시연된 교장은 모든 위치에서 작동합니다. 우리는 일반적으로 사용되는 통계 소프트웨어인 Excel과 SPSS를 사용할 것입니다.

데이터 찾기

양질의 데이터를 찾는 것은 정확한 모델을 구축하는 첫 번째 단계이며 아마도 가장 중요할 것입니다. "가비지 인, 가비지 아웃"이라는 문구는 모두 들어보았지만 완벽한 데이터 세트는 없다는 것을 기억하는 것이 중요합니다. 표본 데이터가 전체 모집단을 대표한다고 편안하게 가정할 수 있는 한 괜찮습니다. 부동산 데이터에는 세 가지 주요 소스가 있습니다.

  1. 최초의 가장 좋은 데이터 출처는 정부 기관입니다. 이 데이터의 대부분은 무료이거나 비교적 저렴한 비용입니다. 많은 회사에서 무료로 쉽게 얻을 수 있는 데이터에 대해 요금을 부과하므로 데이터를 구매하기 전에 항상 인터넷을 빠르게 살펴보십시오. 웹 검색은 찾고 있는 카운티 또는 도시와 "세금 평가자", "세금 감정", "부동산 기록" 또는 "증서 검색"과 같은 단어를 검색하여 결과를 얻을 수 있습니다. 지리 정보 시스템(GIS) 부서는 많은 커뮤니티에서 가장 간과되는 부분 중 하나입니다. 그들은 종종 다양한 다른 지역 기관에서 수집한 많은 데이터를 가지고 있습니다. 부동산 개발자로서 저는 종종 개발을 위한 새로운 부동산을 찾는 데 도움이 되는 모델을 구축하는 데 사용한 고품질 데이터를 찾는 데 도움을 받았습니다. 경제 개발 조직도 훌륭한 데이터 소스가 될 수 있습니다.
  2. 영리를 목적으로 하는 공급업체는 또 다른 옵션입니다. 여러 영역에서 데이터를 찾을 때 특히 유용합니다. 데이터에 많은 돈을 지불하기 전에 숙제를 했는지 확인하십시오. 샘플 데이터 세트에만 의존하지 마십시오. 완전성 측면에서 오해의 소지가 있기 때문입니다. 사용 가능한 데이터가 무엇인지 확실하지 않은 경우 담당자에게 직접 문의하거나 환불 보장에 대해 문의하세요.
  3. 마지막으로, 현지 MLS(Multiple Listing Services)는 귀중한 자원입니다. 대부분의 부동산은 MLS의 회원인 부동산 중개인을 통해 판매됩니다. 일반적으로 MLS 회원은 모든 목록을 로컬 시스템에 입력해야 합니다. 불행히도 MLS 가입에는 많은 제한이 있으며 데이터 액세스 비용이 상당히 높을 수 있습니다. 또한 데이터를 사용할 때 서비스 약관을 위반하지 않도록 하고 잠재적인 책임을 지는 것이 중요합니다.

이 예제에서는 Western Pennsylvania Regional Data Center와 U.S. Census Bureau에서 가져온 무료 데이터를 독점적으로 사용할 것입니다. Alleghany 부동산 판매 데이터는 판매 가격을 종속 변수(Y 변수)로 사용하여 관찰에 대한 기본 파일을 제공합니다. 또한 각 인구 조사 지역의 도보 점수와 세금 감정 정보를 사용하여 변수를 테스트할 것입니다.

부동산 모델을 구축할 때 매우 유용한 변수 중 하나는 각 주소의 위도와 경도입니다. 거리 주소를 사용하여 위도와 경도를 지정하는 지오코더를 통해 이 데이터를 얻을 수 있습니다. U.S.

새 변수를 분석, 변환 및 생성합니다.

이제 데이터 소스를 선택했으므로 데이터 품질을 검사해야 합니다. 데이터 품질을 확인하는 가장 쉬운 방법은 몇 가지 주요 변수에 대한 빈도 테이블을 실행하는 것입니다. 누락되거나 손상된 항목이 많이 있는 경우 데이터를 추가로 조사해야 합니다. 아래 표는 216,498개의 레코드 중 1개만 판매 파일에 누락된 우편 번호가 있고 99999 또는 1X#45와 같은 잘못된 우편 번호가 없음을 보여줍니다. 이는 고품질 데이터세트임을 나타냅니다.

데이터 사전은 가능한 경우 훌륭한 리소스입니다. 각 변수가 측정하는 항목과 변수에 대한 가능한 옵션에 대한 설명을 제공합니다. 우리 데이터에는 카운티에서 수행된 각 판매에 대한 분석이 포함되어 있습니다. 이것은 특히 원시 증서 기록으로 작업할 때 핵심 정보입니다. 모든 부동산 거래는 법으로 집행 가능하도록 기록되어야 하지만 모든 양도가 부동산의 진정한 공정 시장 가치를 반영하는 것은 아닙니다. 예를 들어, 두 가족 구성원 간의 판매는 선물의 형태로 또는 증서 인지와 같은 더 높은 거래 비용을 지불하는 것을 피하기 위해 시장 가격보다 낮을 수 있습니다. 운 좋게도 지방 정부는 현재 시장 가치를 나타내지 않는다고 생각되는 이전을 명확하게 표시하므로 "유효한 판매"를 반영하는 기록만 사용할 것입니다. 이러한 판매는 총 거래 수의 약 18%에 불과하며, 분석에 데이터를 사용하기 전에 데이터를 이해하는 것이 얼마나 중요한지 보여줍니다. 내 경험에 따르면 이 비율은 증서 기록을 분석할 때 매우 일반적입니다. "무효 판매"가 포함된 모델을 구축하면 최종 결과가 왜곡될 가능성이 높습니다.

다음으로 평가 데이터와 도보 점수를 판매 파일에 추가합니다. 이것은 우리의 모델에 사용할 하나의 단일 테이블을 제공합니다. 이 시점에서 변수를 분석하여 선형 회귀에 적합한지 확인해야 합니다. 다음은 다양한 유형의 변수를 보여주는 표입니다.

우리 파일에는 순서 없이 데이터를 분류하는 이웃 또는 우편 번호와 같은 몇 가지 명목 값이 포함되어 있습니다. 명목 값은 변환이 없는 선형 회귀에 적합하지 않습니다. 건설 품질, 부동산의 현재 상태 등을 등급화하는 몇 가지 순서 변수도 있습니다. 순서 데이터의 사용은 각 순위가 균등한 간격을 두고 있다고 합리적으로 가정할 수 있는 경우에만 적절합니다. 예를 들어, 우리 데이터에는 19개의 다른 분류(A+, A, A- 등)가 있는 등급 변수가 있으므로 이러한 등급이 균등한 간격을 두고 있다고 안전하게 가정할 수 있습니다.

또한 모델에서 사용하기 전에 변환해야 하는 몇 가지 변수가 있습니다. 테스트를 위해 더미 변수로 변환할 수 있는 명목 값 중 하나는 가열 및 냉각 변수입니다. 에어컨이 없는 모든 속성에 대해 변수를 0으로 설정하고 에어컨이 있는 속성에 대해 1로 설정합니다. 또한 문자 등급을 숫자로 변환해야 합니다(예:0=최악, 1=좋음, 2=최고). 가격과 선형 관계가 있는 경우.

마지막으로 모든 관찰을 사용하는 것이 적절한지 결정해야 합니다. 단독 주택의 가치를 예측하여 데이터에서 모든 상업용 부동산, 콘도 및 연립 주택을 제거할 수 있습니다. 또한 자기 상관의 잠재적인 문제를 피하기 위해 2017년 판매 데이터만 사용하여 이러한 문제가 발생할 가능성을 제한합니다. 관련 없는 모든 레코드를 제거한 후 테스트할 최종 데이터 세트가 있습니다.

샘플 및 변수 선택

올바른 표본 크기를 선택하는 것은 까다로울 수 있습니다. 학술 자료 중에는 다양한 최소 수와 다양한 경험 법칙이 제시되어 있습니다. 우리 연구의 경우 전체 인구가 상당히 많기 때문에 표본이 충분하다고 걱정할 필요가 없습니다. 대신 표본이 너무 커서 거의 모든 변수가 모델에서 통계적 유의성을 가질 위험이 있습니다. 결국 약 10%의 레코드가 모델링을 위해 무작위로 선택되었습니다.

변수 선택은 통계 소프트웨어가 없는 프로세스에서 가장 어려운 부분 중 하나일 수 있습니다. 그러나 SPSS를 사용하면 선형 회귀에 적합하다고 판단되는 변수 조합에서 많은 모델을 빠르게 구축할 수 있습니다. SPSS는 통계적 유의성에 대한 임계값을 기반으로 변수를 자동으로 필터링하고 최상의 모델만 반환합니다.

모델 구축 및 결과 검토

샘플 데이터에서 SPSS는 5개의 모델을 생성했습니다. 가장 예측 가능한 모델은 다음 5가지 변수를 포함했습니다.

  1. 1-19 등급의 건설 품질에 따른 등급(1=매우 나쁨 및 19=우수)
  2. 완성된 거실 공간
  3. 에어컨(예/아니오)
  4. 로트 크기
  5. 신체 상태 또는 수리 상태에 대한 등급 1-8 등급(1=거주 불가능 및 8=우수)

SPSS의 결과를 살펴보겠습니다. 우리의 주요 초점은 처음에 회귀에 의해 예측되는 종속 변수(가격)의 분산 비율을 알려주는 R-제곱 값에 있습니다. 가장 좋은 값은 1이고 우리 모델의 결과는 매우 유망합니다. 모델의 정밀도를 측정하는 추정치의 표준 오차는 $73,091로 상당히 높은 것으로 보입니다. 그러나 이를 모델의 판매가 표준편차($160,429)와 비교하면 오차가 합리적으로 보입니다.

모델 5에는 허용 가능한 표준 오류가 있었고 Durbin-Watson 테스트를 통과했습니다.

SPSS에는 Durbin-Watson 테스트를 사용하여 자기 상관을 테스트하는 기능이 내장되어 있습니다. 이상적으로는 0에서 4까지의 범위에서 값이 2.0이지만 1.652의 값은 경보를 발생시키지 않아야 합니다.

다음으로 이분산성의 증거가 있는지 확인하기 위해 모델의 결과를 테스트합니다. SPSS에는 내장 기능이 없지만 Ahmad Daryanto가 작성한 이 매크로를 사용하여 Breusch-Pagan 및 Koenker 테스트를 사용할 수 있습니다. 이 테스트는 아래 차트의 유의 수준(Sig)이 .005 미만이므로 우리 모델에 이분산성이 있음을 보여줍니다. 우리 모델은 선형 회귀의 고전적인 가정 중 하나를 위반했습니다. 문제를 제거하려면 모델의 변수 중 하나를 변환해야 할 가능성이 큽니다. 그러나 이 작업을 수행하기 전에 이분산성이 독립 변수의 예측력에 어떤 영향을 미치는지 확인하는 것이 좋습니다. Andrew F. Hayes가 개발한 매크로를 사용하여 독립 변수의 조정된 표준 오차와 유의 수준을 확인할 수 있습니다.

모델에 이분산성이 있지만 추가 테스트에서는 독립 변수에 영향을 미치지 않음을 보여줍니다.

추가 테스트 결과 독립 변수가 모델의 이분산성을 고려한 후에도 통계적으로 유의미한 것으로 나타났으므로 지금 당장 변경할 필요는 없습니다.

모델 테스트 및 수정

최종 테스트로 원래 샘플에 포함되지 않은 모든 판매 기록을 모델로 채점합니다. 이렇게 하면 모델이 더 큰 데이터 집합에서 어떻게 수행되는지 확인하는 데 도움이 됩니다. 이 테스트의 결과는 추정치의 R-제곱 값과 표준 오차가 대규모 데이터 세트에서 크게 변하지 않았음을 보여줍니다. 이는 우리 모델이 예상대로 수행될 것임을 나타냅니다.

전체 데이터 세트에 모델을 적용하면 유사한 R-제곱 및 표준 오류 값이 관찰되는 샘플과의 일관성을 보여줍니다.

실생활에서 예제 모델을 사용하려면 더 정확한 여러 모델을 갖도록 데이터를 더 세분화하거나 이 단일 모델의 정밀도를 향상시키기 위해 추가 데이터를 찾을 것입니다. 이러한 단계는 또한 우리가 모델에서 본 이분산성을 제거할 가능성이 있습니다. 인구 100만 명이 넘는 카운티의 주택 가치를 예측하기 위해 단일 모델을 사용하려고 시도했다는 사실을 기반으로 하여 단 몇 시간 만에 "완벽한" 모델을 구축할 수 없었던 것은 놀라운 일이 아닙니다. .

결론

우리의 목표는 단독 주택의 가치를 예측하는 모델을 구축하는 것이었습니다. 우리의 분석은 우리가 합리적인 정도의 정밀도로 그 목표를 달성했음을 보여주지만 우리의 모델이 의미가 있습니까?

우리가 우리의 모델을 설명한다면 집의 가치는 부지의 크기, 집의 평방 피트, 건축의 질, 현재 수리 상태 및 그것이 있는지 여부에 달려 있다고 말할 것입니다. 공기 조절. 이것은 매우 합리적으로 보입니다. 실제로 우리 모델을 전통적인 평가 방법과 비교하면 현재 노후화 상태에 맞게 조정된 토지 취득 및 새 건물 건설 비용을 추가하는 비용 접근 방식과 매우 유사하다는 것을 알 수 있습니다. 그러나 이러한 유사성은 회귀 구문을 사용하여 의사 상관 관계가 될 수 있습니다.

일반적으로 비용 접근 방식은 유일합니다. 오래된 자산의 감가상각을 위한 적절한 방법을 결정하는 데 문제가 있으므로 새로운 자산의 가치를 평가하는 데 권장됩니다. 우리 모델을 사용하여 모든 연령의 속성에 유용한 유사한 전략을 만들었습니다. 실제로 연령을 독립 변수로 테스트했으며 속성 값에 통계적으로 유의미한 영향이 없다는 결론을 내렸습니다!

귀사의 비즈니스에 회귀 분석 사용

지금쯤이면 회귀 분석의 기본 사항을 더 잘 이해하셨기를 바랍니다. 다음 질문은 비즈니스에 도움이 될 수 있습니까? 이 질문 중 하나라도 예라고 답하면 회귀 분석을 도구로 사용하는 것이 좋습니다.

  1. 가치 결정, 예측 또는 특정 시장 분석에 보다 과학적인 접근 방식을 원하십니까?
  2. 광역, 지역 또는 전국적으로 잠재적인 부동산 투자를 식별할 수 있는 더 나은 방법을 찾고 계십니까?
  3. 상업용 부동산 프로젝트를 위해 대형 소매업체, 레스토랑 또는 숙박업체를 유치하는 것이 목표입니까?
  4. 새로운 데이터 요소를 프로세스에 통합하여 의사 결정 프로세스를 잠재적으로 개선할 수 있다고 생각하십니까?
  5. 구매자와 투자자를 위한 마케팅 투자 수익이 걱정되십니까?

위의 예제 모델은 부동산에서 회귀 모델링을 사용하는 것의 가치에 대한 간단한 데모입니다. 데이터를 수집하고 모델을 구축하는 데 걸린 2~3시간은 잠재력을 충분히 발휘하지 못합니다. 실제로 다음을 포함하여 부동산 가치 평가를 넘어 부동산 산업에서 회귀 분석을 위한 다양한 용도가 있습니다.

  1. 정가 및 임대료에 대한 가격 분석
  2. 주택 구매자와 세입자에 대한 인구통계학적 및 심리학적 분석.
  3. 직접 마케팅 대상 파악
  4. 마케팅 캠페인을 위한 ROI 분석

지리 공간 모델링은 부동산에서 가장 중요한 세 가지 요소인 위치, 위치, 위치와 결합된 회귀 분석 원칙을 사용합니다. 8년 동안 주거용 개발자로 일하면서 지리 공간 모델링의 힘을 증명할 수 있습니다. ArcGIS를 사용하여 판매 데이터, 필지 지도, 라이더 데이터를 통합하여 North Carolina 산에서 개발하기에 이상적인 부동산을 찾을 수 있었습니다.

제 경험에 비추어 볼 때 부동산에 들어가는 돈의 대부분은 프로젝트 개발이 아닌 인수에서 나옵니다. 다른 사람들이 놓친 기회를 식별할 수 있다는 것은 부동산에서 엄청난 경쟁 우위가 될 수 있습니다. 지리 공간 분석은 대기업에서 수년 동안 활용해 왔지만 소규모 기업에서는 간과하는 경우가 많습니다.

귀하의 비즈니스에 적합한 분석 파트너를 식별하는 방법

통계를 가장 좋아하는 주제로 평가하는 사람은 거의 없습니다. In fact, as a whole people are very bad at understanding even basic probabilities. If you’re doubtful of this opinion, take a trip to Las Vegas or Macau. Unfortunately, this can make it difficult to determine who to trust when you’re looking for advice on implementing regression analysis in your process. Here are some key things to look for when evaluating potential candidates

While people are bad at judging probabilities, intuition is actually rather good at detecting lies. You should be very skeptical of anyone who claims to be able to build a model that will answer all your questions! Don’t trust a guarantee of results. Hopefully, this article has illustrated the fact that regression analysis is based on empirical observation and sound science. It will always be the case that certain things are easier to predict than others. A trusted advisor will be open and honest when they can’t find the answers you’re looking for, and they won’t run through your budget trying to find one that isn’t there.

Look for Mr. Spock instead of Captain Kirk. Sound research can be an excellent marketing tool, but far too often people pay for sexy marketing materials with a whiff of pseudo-research and no logic to back it up. Some people are naturally more analytical, but great analytical skills come from practice. Ideally, anyone you hire to analyze data for your business will have experience finding solutions to a wide variety of problems. Someone with a narrow focus may be more susceptible to groupthink, especially when their experiences closely mirror your own.

Put potential candidates on the spot with questions that help demonstrate their reasoning abilities. This is not the time to rely on behavioral questions alone. Ideal candidates will have the ability to strategically use known information to reasonably estimate the answer to complex problems. Ask logical reasoning questions, like “How many tennis balls could you fit in the Empire State Building?”

Finally, you should look for someone with whom you can communicate. All of the information in the world won’t help if you can’t put it to good use. If someone uses so much jargon in an introductory conversation that your eyes start to glaze over, then they probably aren’t the right fit for your company.


기업 자금 조달
  1. 회계
  2. 사업 전략
  3. 사업
  4. 고객 관계 관리
  5. 재원
  6. 주식 관리
  7. 개인 금융
  8. 투자하다
  9. 기업 자금 조달
  10. 예산
  11. 저금
  12. 보험
  13. 은퇴하다